Перевод аудио в текст
«Перевод аудио в текст» — это формальное обозначение процесса транскрибации: нейросеть слушает запись и выдаёт структурированный письменный текст. В отличие от разговорного «перевести» — это устойчивый технический термин, используемый в документах, ТЗ и договорах. Dicto выполняет перевод за 2 минуты на час записи с точностью 98%, автоматически расставляет пунктуацию, разделяет спикеров и добавляет AI-анализ поверх готового текста.
Попробовать перевод бесплатноБез карты · 180 минут бесплатно при регистрации
Процесс
/01
Поддерживаются все распространённые форматы: MP3, WAV, FLAC, OGG, M4A, AAC, WebM. Видеофайлы MP4 и MOV тоже принимаются — аудиодорожка извлекается автоматически через FFmpeg. Лимит 500 МБ и 6 часов длительности. Можно вставить публичную ссылку на YouTube, VK Video, Rutube, OK или Яндекс.Дзен.
/02
Foundation-модель Voxtral последовательно: отделяет речь от пауз и фонового шума, распознаёт слова в контексте (не по словарю, а предсказательно), расставляет знаки препинания и формирует абзацы. Diarization-модель параллельно разделяет реплики разных спикеров — до 10 голосов. Автоопределение языка из 13 поддерживаемых.
/03
На выходе — текст с таймкодами и цветной разметкой спикеров, который можно редактировать прямо в браузере. AI дополнительно формирует саммари за 30 секунд, ключевые тезисы и список action items. Экспорт: TXT, SRT, DOCX. RAG-чат: задайте вопрос по записи — «что решили по бюджету?» — получите цитату с минутой.
Преимущества
Тарифы
Начните бесплатно. Переходите когда нужно больше минут.
/free
180 минут при регистрации
/start
10 часов, спикеры, AI-инсайты
/pro
25 часов, RAG-чат
FAQ
Да, это синонимы, обозначающие один процесс: преобразование устной речи в письменный текст. «Транскрибация» — профессиональный технический термин, применяемый в лингвистике и IT-документах. «Перевод аудио в текст» — более понятное описательное выражение, часто встречается в договорах и техзаданиях. «Расшифровка» — бытовой синоним. Все три слова описывают одну и ту же операцию, качество и функции сервиса не зависят от того, какой термин вы используете.
На студийных или микрофонных записях без фонового шума — 98-99%. На записях с телефона или ноутбука — 95-97%. На конференц-звонках или записях с эхом — 90-94%. Алгоритм использует контекстное предсказание: если слово плохо слышно, нейросеть «достраивает» его по соседним словам. Специфическую профессиональную терминологию (медицина, юриспруденция) можно улучшить, указав словарь терминов в настройках.
Да, поддерживается 13 языков с автоопределением: русский, английский, немецкий, французский, испанский, итальянский, португальский, китайский, японский, казахский, украинский, белорусский, польский. Язык определяется автоматически — не нужно выбирать вручную. Если в записи несколько языков смешаны (code-switching), точность может снизиться на 3-5% на смешанных фрагментах.
На тарифе Старт (500 ₽/мес, 600 минут) — около 50 ₽ за час или 0,83 ₽ за минуту. На тарифе Про (820 ₽/мес, 1500 минут) — около 33 ₽ за час или 0,55 ₽ за минуту. Для сравнения: фрилансер-транскрибатор берёт 300-600 ₽ за час и выполняет работу за 1-2 дня. Первые 180 минут (3 часа) — бесплатно при регистрации.
Аудиофайл хранится в зашифрованном S3-хранилище Selectel (Россия) и удаляется автоматически через 7 дней. Текст транскрипции сохраняется в вашем кабинете до удаления аккаунта. Доступ только у вас — данные не передаются третьим лицам и не используются для обучения моделей. Сервис работает в соответствии с 152-ФЗ о персональных данных.
Сожмите файл перед загрузкой. Для аудио: пересохраните в MP3 с битрейтом 128 kbps — час звука займёт ~55 МБ, что заметно меньше лимита. Для видео: извлеките аудиодорожку через ffmpeg или любой конвертер (это бесплатно), тогда размер уменьшится в 5-10 раз. Альтернативно — разбейте запись на части по 1-2 часа и загрузите каждую отдельно.
Да, мы предоставляем REST API для автоматической отправки файлов на перевод и получения результата. API доступен на тарифах Старт и Про. Документация на https://dicto.pro/docs. Для нестандартных объёмов или условий интеграции — напишите на support@dicto.pro, обсудим индивидуальные условия.
По теме
Страница с разговорным вариантом того же запроса
ПерейтиПрофессиональный термин — то же самое, другое слово
ПерейтиБытовое название процесса перевода речи в текст
ПерейтиКак начать без карты и автоматических списаний
ПерейтиКак работает Voxtral и почему он точнее Whisper
Перейти