Казахский язык

Транскрибация аудио на казахском языке — нейросетью

Казахский язык поддерживается в Dicto на основе foundation-модели Voxtral V2 с автоматическим определением. Это редкий рынок: большинство западных сервисов транскрибации либо не поддерживают казахский вовсе (Otter, Sonix), либо распознают его как «русский с акцентом» (что катастрофически снижает точность). Dicto использует модель, обученную в том числе на казахоязычных корпусах — лекциях, новостях из Казахстана, подкастах. Точность 92-95% на чистом аудио — ниже чем на русском (98%), но это значительно выше альтернатив. Особенно полезно для журналистов и медиа в РК, корпоративных совещаний на казахском, образовательных лекций КазНУ и Nazarbayev University.

Расшифровать казахский бесплатно

Без карты · 180 минут бесплатно при регистрации

Процесс

Как это работает

/01

Загрузите запись

Аудио или видео до 500 МБ. Поддерживаются все распространённые форматы. Можно вставить ссылку на YouTube, VK Video, Rutube — мы скачаем аудиодорожку. Идеально подходит для расшифровки контента казахоязычных СМИ: Tengrinews, NUR.KZ, Sputnik Казахстан, новости КТК и Хабар.

/02

AI распознаёт казахский

Voxtral V2 автоопределяет язык — не нужно вручную переключать в настройках. На чистой студийной записи (новости, подкасты) — точность 92-95%. На звонках и встречах — 88-93%. Diarization до 10 спикеров с цветовой кодировкой. Поддерживаются обе графики: кириллица (основная) и латиница (для нового алфавита).

/03

Получите текст

Текст с таймкодами, разметкой спикеров, AI-саммари на русском или казахском (выбор в настройках). Экспорт в TXT, SRT-субтитры или DOCX. Особенно полезно для блогеров и медиа: расшифровать интервью с экспертом на казахском, перевести саммари на русский для редакторов в Алматы.

Преимущества

Что вы получаете

Точность 92-95% на чистом казахском — значительно выше альтернатив (Whisper ~80%)
Автоопределение языка — не нужно вручную переключать казахский в настройках
Поддержка обоих алфавитов: кириллица (текущая) и латиница (новая)
Разметка до 10 спикеров (diarization) — для интервью и совещаний
Смешанная казахско-русская речь распознаётся — переключение между языками на лету
AI-саммари можно сгенерировать на русском (полезно для билингвальных команд)
Файлы хранятся в РФ (Selectel) — рядом с пользователями в Центральной Азии
Экспорт SRT для YouTube — субтитры в правильной кодировке UTF-8
180 минут бесплатно — без банковской карты
Подходит для пользователей из РК: оплата через Kaspi.kz, Halyk Bank (в работе)

Тарифы

Простые и прозрачные

Начните бесплатно. Переходите когда нужно больше минут.

/free

0 ₽

180 минут при регистрации

/start

500 ₽/мес

10 часов, спикеры, AI-инсайты

/pro

820 ₽/мес

25 часов, RAG-чат

Все тарифы

FAQ

Частые вопросы

QКакая точность распознавания казахского у Dicto?

На чистой студийной записи (новости, профессиональные подкасты) — 92-95%. На записях со смартфона или ноутбука — 88-92%. На звонках и встречах с шумом — 85-90%. Это значительно выше альтернатив: Whisper Large v3 на казахском даёт 75-82%, Google Speech-to-Text не поддерживает официально (распознаёт как «турецкий с ошибками»), Yandex SpeechKit ~85-88%. Voxtral V2 — пока лучший вариант для казахского на рынке.

QПоддерживается ли смесь казахского и русского в одной записи?

Да, это популярный сценарий в РК. Бытовая речь часто смешивает оба языка («Мен мынаны айтайын...»). AI автоматически переключается между языками внутри одной фразы. Точность может снижаться на 3-5% по сравнению с одноязычной записью. Если переключений много, рекомендуем явно указать «казахский» в настройках — тогда AI будет «принуждать» казахский даже на спорных моментах с русскими словами.

QКакой алфавит используется в выходном тексте — кириллица или латиница?

По умолчанию кириллица (текущий официальный алфавит казахского в РК). Латиница (новая реформа) пока в работе как опция. Если вы хотите получить текст в латинице — пока придётся транслитерировать в постобработке. Мы планируем добавить переключатель алфавита в течение 2-3 месяцев. Для большинства пользователей кириллица более удобна — она поддерживается в Word, Telegram, всех мобильных клавиатурах.

QПодходит ли сервис для медиа и журналистов в Казахстане?

Да, это один из основных кейсов. Расшифровка интервью с экспертом, перевод выступлений политиков на русский, создание субтитров для YouTube-канала, обработка пресс-конференций. Время от записи до готового текста — 2-3 минуты на час аудио. Цена 0,83 ₽/минута на тарифе Старт — это значительно дешевле фрилансера (5-10 ₽/минута в РК). Для медиа-команд тариф Бизнес 2 300 ₽/мес на 5 человек.

QБезопасно ли передавать казахоязычные записи на серверы в РФ?

Файлы хранятся в Selectel, Москва (зона ru-7) с шифрованием TLS 1.3. Расшифровка идёт через API foundation-моделей с DPA-договором, запрещающим использование данных для обучения. Для большинства бизнес-задач этого достаточно. Если работаете с государственной тайной РК или критически чувствительными данными — мы можем обсудить выделенную инсталляцию (on-premise) для крупных корпоративных клиентов. Свяжитесь с support@dicto.pro для уточнения.

QЧто насчёт диалектов казахского? Северный, южный, западный?

Литературный казахский (телевидение, новости, учебники) — точность 92-95%. Северные диалекты (Костанай, Павлодар) — близки к литературному, точность сохраняется. Южные диалекты (Шымкент, Туркестан) — точность 90-93%, есть отдельные особенности произношения. Западные (Атырау, Актау) — 88-92%. Очень специфичные сельские говоры могут давать 85-88%. Это лучший результат среди доступных AI-сервисов для казахского сегодня.

QМожно ли расшифровать казахские песни или стихи?

Пение AI не распознаёт — мелодия искажает фонетику, и модель не обучалась на песнях. Декламированные стихи (без музыки, ритмично прочитанные) — точность 88-93%, ниже обычной речи из-за специфической интонации. Айтыс (импровизированные песенные состязания) — практически не работает, точность 60-70%. Для художественных задач (расшифровка казахской народной музыки, эпоса «Манас» на похожем кыргызском) — лучше брать филолога-специалиста.

QБудут ли добавлены другие тюркские языки — узбекский, кыргызский, татарский?

В планах. Voxtral V2 уже понимает узбекский и кыргызский на уровне 80-85% (без официальной поддержки), татарский — 75-80%. Мы планируем добавить их в список официально поддерживаемых языков в течение 6 месяцев, после набора достаточной статистики качества. Если вам срочно нужен один из этих языков для бизнеса — напишите на support@dicto.pro, мы можем включить расширенные настройки досрочно.

Транскрибация на казахском языке

Попробовать бесплатно