Для журналистов
Час интервью — это 4-6 часов ручной расшифровки: прослушать, остановить, напечатать, перемотать. С Dicto тот же час записи превращается в готовый текст за 2 минуты. AI разметит спикеров, расставит пунктуацию и подготовит DOCX с таймкодами, откуда удобно брать дословные цитаты. Хранение файлов в РФ, 152-ФЗ — конфиденциальность источников защищена.
Расшифровать интервью бесплатноБез карты · 180 минут бесплатно при регистрации
Процесс
/01
Используйте диктофон, смартфон или запись со встречи — подходят MP3, WAV, M4A, FLAC, OGG, AAC, а также видео MP4 и MOV. Для телефонных или Zoom-интервью нажмите «Запись» в приложении — Dicto примет файл любого качества. Максимальный размер файла 500 МБ.
/02
Нейросеть транскрибирует речь за 2 минуты на каждый час записи и автоматически определит до 10 голосов: интервьюер, респондент, третий участник. Каждая реплика получает таймкод — кликните на цитату и тут же услышите оригинал.
/03
Скачайте расшифровку в DOCX или SRT, откройте в Word или Google Docs и правьте как обычный документ. AI-саммари сразу даёт тезисы и ключевые высказывания — это черновик лида. Action items выделяют обещания, цифры и договорённости спикера.
Преимущества
Тарифы
Начните бесплатно. Переходите когда нужно больше минут.
/free
180 минут при регистрации
/start
10 часов, спикеры, AI-инсайты
/pro
25 часов, RAG-чат
FAQ
Да. Профессиональный диктофон (Sony, Zoom, Olympus) даёт 97-98% точность даже в шумном кафе. Смартфон — 95-97%, если держать его на расстоянии 30-50 см от собеседника. Для телефонного интервью точность немного ниже (93-96%) из-за сжатия кодека — используйте приложение запись звонков с высоким битрейтом или договоритесь о Zoom-звонке.
Voxtral предварительно фильтрует фоновый шум, поэтому запись в кафе или на улице даёт приемлемое качество (92-96%). На пресс-конференции с несколькими журналистами и галдящей толпой точность снизится до 88-93%. Совет: держите диктофон или телефон как можно ближе к рту спикера — это важнее качества микрофона.
Diarization (разметка спикеров) автоматически выделяет голоса и называет их «Спикер 1», «Спикер 2» и т.д. При необходимости можно переименовать прямо в редакторе — поменяйте «Спикер 1» на «Иванов» и все его реплики обновятся. Для группового интервью с тремя и более участниками система корректно разделяет до 10 голосов.
Каждая реплика в Dicto имеет таймкод. Выделите нужный фрагмент — скопируйте цитату вместе с таймкодом одной кнопкой. В SRT-файле каждая строка уже содержит временной диапазон, что удобно для видеомонтажа. Это особенно важно при работе над мультимедийными материалами — точно найти фрагмент и нарезать видео значительно проще.
Файлы хранятся только в российских дата-центрах (Selectel) с шифрованием при передаче и хранении. Доступ к вашим файлам есть только у вас — сотрудники Dicto не просматривают содержимое без судебного запроса российского суда. Аудиофайл автоматически удаляется через 7 дней, текст хранится до удаления аккаунта. Соответствие 152-ФЗ подтверждено.
Да, Dicto поддерживает 13 языков: русский, английский, немецкий, французский, испанский, итальянский, португальский, китайский, японский, казахский, украинский, белорусский, польский. Язык определяется автоматически. Для интервью с иностранным спикером получите точный транскрипт на языке оригинала, а перевод сделайте отдельно с готового текста — это быстрее и дешевле, чем транскрибировать на другом языке.
По теме
Детальная страница об услуге
ПерейтиОбщий обзор транскрибации аудиозаписей
ПерейтиАвтоматический протокол для деловых встреч
ПерейтиПошаговый гайд для онлайн-встреч
ПерейтиКомандный доступ и расширенные лимиты
Перейти