Гайды2026-04-156 мин

SRT, VTT, DOCX, TXT — какой формат экспорта выбрать

После расшифровки нужно экспортировать текст — но в каком формате? Разбираем плюсы и минусы SRT, VTT, DOCX и TXT.

Четыре основных формата

После транскрибации сервис обычно предлагает несколько форматов экспорта. В Dicto их четыре: TXT, SRT, DOCX и копирование в буфер. Каждый имеет свою область применения. Разбираем когда что выбирать.

TXT — простой текст

Что это: plain text без форматирования. Только символы, переносы строк, пробелы.

Структура в Dicto:

Спикер 1: Привет, как дела?

Спикер 2: Нормально, а у тебя?

Спикер 1: Тоже нормально, спасибо.

Когда использовать:

Импорт в LLM (ChatGPT, Claude, Gemini) для последующей обработки
Импорт в Notion, Obsidian, Roam Research
Поиск через grep или ripgrep на компьютере
Простое хранение в архиве

Плюсы: работает везде, минимальный размер, не привязан к ПО.

Минусы: нет таймкодов, нет форматирования, теряется визуальное разделение спикеров.

SRT — субтитры с таймкодами

Что это: SubRip Subtitle — самый популярный формат субтитров с 1990-х. Текстовый файл с блоками.

Структура:

1

00:00:00,000 --> 00:00:03,200

Привет, как дела?

2

00:00:03,500 --> 00:00:06,800

Нормально, а у тебя?

Каждый блок: номер, таймкод начала-конца, текст. Разделитель — пустая строка.

Когда использовать:

Субтитры для YouTube (загрузка в Studio → раздел «Субтитры»)
Премьер Pro, Final Cut, DaVinci Resolve — вшивание субтитров в видео
VLC, Media Player Classic, OBS — отображение субтитров поверх видео
Подкаст-платформы, поддерживающие транскрипты (Apple Podcasts с 2023)

Плюсы: универсальная поддержка, открытый формат, легко редактировать в любом текстовом редакторе.

Минусы: нет стилей (цвета, шрифты, позиции), нет разметки спикеров.

VTT — WebVTT для современного веба

Что это: WebVTT (Web Video Text Tracks) — наследник SRT для HTML5-видео. Поддерживается W3C.

Структура:

WEBVTT

00:00:00.000 --> 00:00:03.200

Привет, как дела?

00:00:03.500 --> 00:00:06.800 line:90% align:start

Нормально, а у тебя?

Похоже на SRT, но с дополнительными возможностями: стили, позиции, метки времени внутри блока.

Когда использовать:

Веб-плееры HTML5 (тег <video> + <track>)
Custom-плееры на JavaScript (Plyr, Video.js)
Современные подкаст-проигрыватели в браузере

Плюсы: мощнее SRT, нативная поддержка в браузерах, можно стилизовать.

Минусы: не везде принимается (старые редакторы не понимают), субтитры YouTube всё-таки лучше в SRT.

Dicto пока не экспортирует VTT — это в roadmap. Конвертация SRT→VTT тривиальна (заменить запятую на точку в таймкоде + добавить заголовок «WEBVTT»).

DOCX — форматированный документ Word

Что это: Microsoft Word документ с разметкой, стилями, таблицами.

Структура в Dicto:

[Заголовок: Транскрипт записи]

[Подзаголовок: Дата записи, длительность]

[Спикер 1, цвет красный] (00:00:00)

Привет, как дела?

[Спикер 2, цвет синий] (00:00:03)

Нормально, а у тебя?

Каждый спикер — отдельным абзацем с цветовой меткой. Таймкоды кликабельные (если открыть в Word и совмещать с аудиоплеером).

Когда использовать:

Передача клиенту/руководству как готовый документ
Юридические стенограммы заседаний
Журналистика — основа для статьи
Хранение в корпоративной системе документооборота

Плюсы: профессиональный вид, разметка спикеров, можно править в Word.

Минусы: проприетарный формат (хотя docx — открытый стандарт), большой размер файла, не для всех нужен.

Сравнение по сценариям

СценарийЛучший формат

|---|---|

YouTube субтитрыSRT
HTML5 веб-плеерVTT
Импорт в ChatGPTTXT
Документ для клиентаDOCX
Архив в NotionTXT или DOCX
Стенограмма судаDOCX
Premiere Pro / Final CutSRT
Reels/TikTok burn-in субтитрыSRT
Анализ через скриптыTXT

Особенности экспорта в Dicto

TXT с таймкодами

По умолчанию TXT в Dicto не содержит таймкодов — это просто текст с разметкой спикеров. Если нужны таймкоды — выбирайте SRT или DOCX. Можно настроить «TXT с таймкодами» в настройках экспорта: тогда формат будет:

[00:00:00] Спикер 1: Привет, как дела?

[00:00:03] Спикер 2: Нормально, а у тебя?

SRT с длиной блока

По умолчанию SRT делает блоки 1-3 секунды (~5-10 слов на блок). Для коротких роликов с большими субтитрами это нормально. Для длинных видео можно настроить блоки 3-5 секунд (~15-25 слов) — меньше мельтешения.

DOCX без цветовой разметки

Если транскрипт идёт в систему документооборота, цветная разметка спикеров может мешать. В настройках экспорта можно отключить цвета — спикеры будут просто bold-текстом.

JSON (в работе)

JSON-экспорт для разработчиков планируется. Формат:

{

"transcript": [

{

"speaker": "Speaker 1",

"start": 0.0,

"end": 3.2,

"text": "Привет, как дела?",

"confidence": 0.97

}

]

}

Это для интеграции с custom workflow — например, если вы строите свой подкаст-сайт с интерактивным транскриптом.

Лайфхаки

1. SRT с длинными блоками — не для всех плееров. YouTube ограничивает до 3 строк по 42 символа. Если в SRT-блоке больше — YouTube обрежет или разобьёт автоматически (часто неудачно).

2. DOCX в Apple Pages — формат может «съесть» цвета спикеров. Лучше открывать в Word или LibreOffice.

3. TXT для AI — добавляйте контекст в начале. Вместо просто текста начните файл с «Это транскрипт интервью с экспертом X на тему Y, дата записи Z» — LLM будет точнее.

4. SRT для Reels — увеличьте размер шрифта в редакторе. Дефолтный размер SRT часто мелкий для вертикальных видео.

5. Конвертация форматов. Если экспортировали в одном формате, а нужен другой — конвертация тривиальна: SRT↔VTT через find-replace, SRT→TXT — отбросить таймкоды, TXT→DOCX — открыть в Word.

Вывод

Нет «лучшего» формата — выбирайте под задачу. Самый универсальный — TXT (работает везде). Самый полезный для видео — SRT. Самый профессиональный — DOCX. Для веб-разработки в перспективе — JSON и VTT.

Попробуйте Dicto бесплатно

180 минут на тест при регистрации. AI-саммари, разметка спикеров — без карты.

Начать бесплатно