Для подкастов
Транскрибация для контент-мейкеров — это превращение голосового контента в множество производных форматов: статьи для блога, посты в Telegram и VK, SRT-субтитры для YouTube, цитаты-цитатник для Reels и Shorts, шоу-ноты для подкаст-платформ. Один час подкаста — это потенциально 5-10 часов работы редактора без AI-помощи. С Dicto: 2 минуты на расшифровку → 30 секунд на AI-саммари → 15 минут на адаптацию в нужный формат. Подкастер из 1 человека может вести качественный канал, который раньше требовал команду из 3-5 редакторов. Особенно выгодно для русскоязычных подкастов: Voxtral V2 даёт 98% точности на русском против 94-95% у Yandex SpeechKit.
Расшифровать подкаст бесплатноБез карты · 180 минут бесплатно при регистрации
Процесс
/01
Загрузите MP3-файл подкаста или вставьте ссылку на YouTube/VK Video. За 2 минуты на час эпизода получаете текст с таймкодами и разметкой спикеров (если в подкасте несколько участников). Точность 98% — основные ошибки можно поправить в редакторе Dicto.
/02
Один клик «AI-саммари» → готовое краткое содержание эпизода для платформ (Apple Podcasts, Yandex Music, Spotify, Google Podcasts). AI-выделение тезисов даёт 5-10 ключевых пунктов для буллет-листа. Action items — если в подкасте были рекомендации (книги, инструменты, ссылки), они автоматически собираются в список.
/03
Из транскрипта одного эпизода: статья для блога (через ChatGPT/GigaChat), 5-10 цитат для постов в Telegram/VK, SRT-субтитры для YouTube-видео, превью-абзацы для соцсетей с кликабельными таймкодами. RAG-чат отвечает «когда обсуждали тему X?» с точной цитатой и таймкодом.
Преимущества
Тарифы
Начните бесплатно. Переходите когда нужно больше минут.
/free
180 минут при регистрации
/start
10 часов, спикеры, AI-инсайты
/pro
25 часов, RAG-чат
FAQ
Прямая загрузка MP3/WAV/M4A — со всех платформ (Apple Podcasts через RSS-фид, Yandex Music через скачивание, Spotify через ссылку на эпизод). Прямые URL: YouTube (включая Shorts), VK Video, Rutube, Одноклассники, Яндекс.Дзен — мы скачиваем аудиодорожку через yt-dlp автоматически. Прямые ссылки на MP3 (SoundCloud, Podster, podcast-хостинги) тоже работают. Что не работает: закрытые подкасты на Patreon (нужен файл вручную), Apple Podcasts Plus (DRM), Spotify (тоже DRM на платных эпизодах).
Самый эффективный workflow: 1) Расшифровка в Dicto → текст с таймкодами. 2) AI-саммари даёт структуру: введение, основные темы, выводы. 3) Копируете транскрипт в ChatGPT/GigaChat с промптом «Переработай этот подкаст в статью 1500 слов с заголовками H2 и H3, сохраняя ключевые цитаты». 4) Получаете черновик за 30 секунд. 5) Редактируете руками — добавляете личный стиль, ссылки, проверяете факты. Время на полноценную статью: 30-45 минут вместо 4-6 часов вручную.
Да, это одна из основных функций. После расшифровки нажмите «Экспорт» → «SRT». Получите файл с таймкодами и текстом, который YouTube Studio принимает в раздел «Субтитры». Также SRT работает в Premiere Pro, Final Cut, DaVinci Resolve для вшивания субтитров в видео. Кодировка UTF-8, таймкоды правильные, разбивка на блоки 1-3 секунды по умолчанию (можно настроить).
Идеально. Diarization распознаёт до 10 разных голосов и помечает каждого цветовой меткой («Говорящий 1», «Говорящий 2» и т.д.). Вы переименовываете их в реальные имена («Ведущий», «Гость Иван Петров», «Гость Ольга Иванова»). На выходе — текст разделён по репликам с указанием кто что сказал. Это критично для длинных интервью на 2-3 часа: иначе разобраться кто что говорил невозможно.
AI игнорирует музыку без слов автоматически. Музыка с вокалом (например, заставка с песней) может частично распознаться как речь — обычно это очевидно по контексту, и легко удаляется в редакторе. Короткие джинглы (3-5 секунд) обычно пропускаются без проблем. Если в подкасте звучит музыка фоном под голос (например, lo-fi бит для атмосферы), точность распознавания речи остаётся 95-97% — модель устойчива к фоновому шуму.
60 минут × 0,83 ₽ = 50 ₽ на тарифе Старт (500 ₽/мес за 600 минут). На бесплатном тарифе — бесплатно (180 минут хватает на 3 часовых эпизода). Для регулярного выпуска (1-2 эпизода в неделю по 1-2 часа) хватает Старта. Для серий длинных интервью (4-6 часов) лучше тариф Про (820 ₽/мес за 1500 минут, 0,55 ₽/мин). Сравните: фрилансер расшифровщик берёт 300-600 ₽ за час, плюс 1-2 дня ожидания — нерационально.
Да, через RAG-чат. После расшифровки эпизода он индексируется в векторной базе. На странице эпизода можно задавать вопросы: «Что говорил гость про инвестиции?», «Когда обсуждали книгу X?», «Какие инструменты упоминались?». AI выдаёт ответ с цитатами и точными таймкодами. Поиск работает по семантике, а не точным словам — то есть на запрос «инвестиции» найдёт фрагменты со словами «вложения», «бизнес», «деньги», даже если буквального слова «инвестиции» не было.
Descript и Riverside — комбайны: запись, монтаж, расшифровка, публикация. У них транскрибация — одна из функций. Dicto специализирован только на расшифровке, но делает это глубже: 98% точности на русском против 94% у Descript, поддержка 13 языков с автоопределением (Descript только английский+несколько), RAG-чат по содержимому (которого нет у Descript). Если нужен полный пайплайн от записи до публикации — Descript или Riverside. Если уже есть свой workflow и нужна только качественная расшифровка с AI-обработкой — Dicto.
По теме
Общая страница про услугу
ПерейтиYouTube, VK Video, Rutube — без скачивания
ПерейтиЕсли расшифровываете видео-формат подкаста
ПерейтиОт записи до публикации — полный workflow
ПерейтиTikTok, Reels, Shorts — лайфхаки
Перейти