Казахский язык
Казахский язык поддерживается в Dicto на основе foundation-модели Voxtral V2 с автоматическим определением. Это редкий рынок: большинство западных сервисов транскрибации либо не поддерживают казахский вовсе (Otter, Sonix), либо распознают его как «русский с акцентом» (что катастрофически снижает точность). Dicto использует модель, обученную в том числе на казахоязычных корпусах — лекциях, новостях из Казахстана, подкастах. Точность 92-95% на чистом аудио — ниже чем на русском (98%), но это значительно выше альтернатив. Особенно полезно для журналистов и медиа в РК, корпоративных совещаний на казахском, образовательных лекций КазНУ и Nazarbayev University.
Расшифровать казахский бесплатноБез карты · 180 минут бесплатно при регистрации
Процесс
/01
Аудио или видео до 500 МБ. Поддерживаются все распространённые форматы. Можно вставить ссылку на YouTube, VK Video, Rutube — мы скачаем аудиодорожку. Идеально подходит для расшифровки контента казахоязычных СМИ: Tengrinews, NUR.KZ, Sputnik Казахстан, новости КТК и Хабар.
/02
Voxtral V2 автоопределяет язык — не нужно вручную переключать в настройках. На чистой студийной записи (новости, подкасты) — точность 92-95%. На звонках и встречах — 88-93%. Diarization до 10 спикеров с цветовой кодировкой. Поддерживаются обе графики: кириллица (основная) и латиница (для нового алфавита).
/03
Текст с таймкодами, разметкой спикеров, AI-саммари на русском или казахском (выбор в настройках). Экспорт в TXT, SRT-субтитры или DOCX. Особенно полезно для блогеров и медиа: расшифровать интервью с экспертом на казахском, перевести саммари на русский для редакторов в Алматы.
Преимущества
Тарифы
Начните бесплатно. Переходите когда нужно больше минут.
/free
180 минут при регистрации
/start
10 часов, спикеры, AI-инсайты
/pro
25 часов, RAG-чат
FAQ
На чистой студийной записи (новости, профессиональные подкасты) — 92-95%. На записях со смартфона или ноутбука — 88-92%. На звонках и встречах с шумом — 85-90%. Это значительно выше альтернатив: Whisper Large v3 на казахском даёт 75-82%, Google Speech-to-Text не поддерживает официально (распознаёт как «турецкий с ошибками»), Yandex SpeechKit ~85-88%. Voxtral V2 — пока лучший вариант для казахского на рынке.
Да, это популярный сценарий в РК. Бытовая речь часто смешивает оба языка («Мен мынаны айтайын...»). AI автоматически переключается между языками внутри одной фразы. Точность может снижаться на 3-5% по сравнению с одноязычной записью. Если переключений много, рекомендуем явно указать «казахский» в настройках — тогда AI будет «принуждать» казахский даже на спорных моментах с русскими словами.
По умолчанию кириллица (текущий официальный алфавит казахского в РК). Латиница (новая реформа) пока в работе как опция. Если вы хотите получить текст в латинице — пока придётся транслитерировать в постобработке. Мы планируем добавить переключатель алфавита в течение 2-3 месяцев. Для большинства пользователей кириллица более удобна — она поддерживается в Word, Telegram, всех мобильных клавиатурах.
Да, это один из основных кейсов. Расшифровка интервью с экспертом, перевод выступлений политиков на русский, создание субтитров для YouTube-канала, обработка пресс-конференций. Время от записи до готового текста — 2-3 минуты на час аудио. Цена 0,83 ₽/минута на тарифе Старт — это значительно дешевле фрилансера (5-10 ₽/минута в РК). Для медиа-команд тариф Бизнес 2 300 ₽/мес на 5 человек.
Файлы хранятся в Selectel, Москва (зона ru-7) с шифрованием TLS 1.3. Расшифровка идёт через API foundation-моделей с DPA-договором, запрещающим использование данных для обучения. Для большинства бизнес-задач этого достаточно. Если работаете с государственной тайной РК или критически чувствительными данными — мы можем обсудить выделенную инсталляцию (on-premise) для крупных корпоративных клиентов. Свяжитесь с support@dicto.pro для уточнения.
Литературный казахский (телевидение, новости, учебники) — точность 92-95%. Северные диалекты (Костанай, Павлодар) — близки к литературному, точность сохраняется. Южные диалекты (Шымкент, Туркестан) — точность 90-93%, есть отдельные особенности произношения. Западные (Атырау, Актау) — 88-92%. Очень специфичные сельские говоры могут давать 85-88%. Это лучший результат среди доступных AI-сервисов для казахского сегодня.
Пение AI не распознаёт — мелодия искажает фонетику, и модель не обучалась на песнях. Декламированные стихи (без музыки, ритмично прочитанные) — точность 88-93%, ниже обычной речи из-за специфической интонации. Айтыс (импровизированные песенные состязания) — практически не работает, точность 60-70%. Для художественных задач (расшифровка казахской народной музыки, эпоса «Манас» на похожем кыргызском) — лучше брать филолога-специалиста.
В планах. Voxtral V2 уже понимает узбекский и кыргызский на уровне 80-85% (без официальной поддержки), татарский — 75-80%. Мы планируем добавить их в список официально поддерживаемых языков в течение 6 месяцев, после набора достаточной статистики качества. Если вам срочно нужен один из этих языков для бизнеса — напишите на support@dicto.pro, мы можем включить расширенные настройки досрочно.
По теме
Транскрибация русской речи с точностью 98%
ПерейтиТранскрибация английского с точностью 99%
ПерейтиОбщая страница про услугу
ПерейтиWER, шум, акценты — подробный разбор
ПерейтиКак работает разметка спикеров
Перейти