SRT, VTT, DOCX, TXT — какой формат экспорта выбрать
После расшифровки нужно экспортировать текст — но в каком формате? Разбираем плюсы и минусы SRT, VTT, DOCX и TXT.
Четыре основных формата
После транскрибации сервис обычно предлагает несколько форматов экспорта. В Dicto их четыре: TXT, SRT, DOCX и копирование в буфер. Каждый имеет свою область применения. Разбираем когда что выбирать.
TXT — простой текст
Что это: plain text без форматирования. Только символы, переносы строк, пробелы.
Структура в Dicto:
Спикер 1: Привет, как дела?
Спикер 2: Нормально, а у тебя?
Спикер 1: Тоже нормально, спасибо.
Когда использовать:
Плюсы: работает везде, минимальный размер, не привязан к ПО.
Минусы: нет таймкодов, нет форматирования, теряется визуальное разделение спикеров.
SRT — субтитры с таймкодами
Что это: SubRip Subtitle — самый популярный формат субтитров с 1990-х. Текстовый файл с блоками.
Структура:
1
00:00:00,000 --> 00:00:03,200
Привет, как дела?
2
00:00:03,500 --> 00:00:06,800
Нормально, а у тебя?
Каждый блок: номер, таймкод начала-конца, текст. Разделитель — пустая строка.
Когда использовать:
Плюсы: универсальная поддержка, открытый формат, легко редактировать в любом текстовом редакторе.
Минусы: нет стилей (цвета, шрифты, позиции), нет разметки спикеров.
VTT — WebVTT для современного веба
Что это: WebVTT (Web Video Text Tracks) — наследник SRT для HTML5-видео. Поддерживается W3C.
Структура:
WEBVTT
00:00:00.000 --> 00:00:03.200
Привет, как дела?
00:00:03.500 --> 00:00:06.800 line:90% align:start
Нормально, а у тебя?
Похоже на SRT, но с дополнительными возможностями: стили, позиции, метки времени внутри блока.
Когда использовать:
<video> + <track>)Плюсы: мощнее SRT, нативная поддержка в браузерах, можно стилизовать.
Минусы: не везде принимается (старые редакторы не понимают), субтитры YouTube всё-таки лучше в SRT.
Dicto пока не экспортирует VTT — это в roadmap. Конвертация SRT→VTT тривиальна (заменить запятую на точку в таймкоде + добавить заголовок «WEBVTT»).
DOCX — форматированный документ Word
Что это: Microsoft Word документ с разметкой, стилями, таблицами.
Структура в Dicto:
[Заголовок: Транскрипт записи]
[Подзаголовок: Дата записи, длительность]
[Спикер 1, цвет красный] (00:00:00)
Привет, как дела?
[Спикер 2, цвет синий] (00:00:03)
Нормально, а у тебя?
Каждый спикер — отдельным абзацем с цветовой меткой. Таймкоды кликабельные (если открыть в Word и совмещать с аудиоплеером).
Когда использовать:
Плюсы: профессиональный вид, разметка спикеров, можно править в Word.
Минусы: проприетарный формат (хотя docx — открытый стандарт), большой размер файла, не для всех нужен.
Сравнение по сценариям
|---|---|
Особенности экспорта в Dicto
TXT с таймкодами
По умолчанию TXT в Dicto не содержит таймкодов — это просто текст с разметкой спикеров. Если нужны таймкоды — выбирайте SRT или DOCX. Можно настроить «TXT с таймкодами» в настройках экспорта: тогда формат будет:
[00:00:00] Спикер 1: Привет, как дела?
[00:00:03] Спикер 2: Нормально, а у тебя?
SRT с длиной блока
По умолчанию SRT делает блоки 1-3 секунды (~5-10 слов на блок). Для коротких роликов с большими субтитрами это нормально. Для длинных видео можно настроить блоки 3-5 секунд (~15-25 слов) — меньше мельтешения.
DOCX без цветовой разметки
Если транскрипт идёт в систему документооборота, цветная разметка спикеров может мешать. В настройках экспорта можно отключить цвета — спикеры будут просто bold-текстом.
JSON (в работе)
JSON-экспорт для разработчиков планируется. Формат:
{
"transcript": [
{
"speaker": "Speaker 1",
"start": 0.0,
"end": 3.2,
"text": "Привет, как дела?",
"confidence": 0.97
}
]
}
Это для интеграции с custom workflow — например, если вы строите свой подкаст-сайт с интерактивным транскриптом.
Лайфхаки
1. SRT с длинными блоками — не для всех плееров. YouTube ограничивает до 3 строк по 42 символа. Если в SRT-блоке больше — YouTube обрежет или разобьёт автоматически (часто неудачно).
2. DOCX в Apple Pages — формат может «съесть» цвета спикеров. Лучше открывать в Word или LibreOffice.
3. TXT для AI — добавляйте контекст в начале. Вместо просто текста начните файл с «Это транскрипт интервью с экспертом X на тему Y, дата записи Z» — LLM будет точнее.
4. SRT для Reels — увеличьте размер шрифта в редакторе. Дефолтный размер SRT часто мелкий для вертикальных видео.
5. Конвертация форматов. Если экспортировали в одном формате, а нужен другой — конвертация тривиальна: SRT↔VTT через find-replace, SRT→TXT — отбросить таймкоды, TXT→DOCX — открыть в Word.
Вывод
Нет «лучшего» формата — выбирайте под задачу. Самый универсальный — TXT (работает везде). Самый полезный для видео — SRT. Самый профессиональный — DOCX. Для веб-разработки в перспективе — JSON и VTT.
Попробуйте Dicto бесплатно
180 минут на тест при регистрации. AI-саммари, разметка спикеров — без карты.
Начать бесплатно