SRT, VTT, DOCX, TXT — какой формат экспорта выбрать
После расшифровки нужно экспортировать текст — но в каком формате? Разбираем плюсы и минусы SRT, VTT, DOCX и TXT.
Четыре основных формата
После транскрибации сервис обычно предлагает несколько форматов экспорта. В Dicto их четыре: TXT, SRT, DOCX и копирование в буфер. Каждый имеет свою область применения. Разбираем когда что выбирать.
TXT — простой текст
Что это: plain text без форматирования. Только символы, переносы строк, пробелы.
Структура в Dicto:
Спикер 1: Привет, как дела?
Спикер 2: Нормально, а у тебя?
Спикер 1: Тоже нормально, спасибо.
Когда использовать:
- Импорт в LLM (ChatGPT, Claude, Gemini) для последующей обработки
- Импорт в Notion, Obsidian, Roam Research
- Поиск через grep или ripgrep на компьютере
- Простое хранение в архиве
Плюсы: работает везде, минимальный размер, не привязан к ПО.
Минусы: нет таймкодов, нет форматирования, теряется визуальное разделение спикеров.
SRT — субтитры с таймкодами
Что это: SubRip Subtitle — самый популярный формат субтитров с 1990-х. Текстовый файл с блоками.
Структура:
1
00:00:00,000 --> 00:00:03,200
Привет, как дела?
2
00:00:03,500 --> 00:00:06,800
Нормально, а у тебя?
Каждый блок: номер, таймкод начала-конца, текст. Разделитель — пустая строка.
Когда использовать:
- Субтитры для YouTube (загрузка в Studio → раздел «Субтитры»)
- Премьер Pro, Final Cut, DaVinci Resolve — вшивание субтитров в видео
- VLC, Media Player Classic, OBS — отображение субтитров поверх видео
- Подкаст-платформы, поддерживающие транскрипты (Apple Podcasts с 2023)
Плюсы: универсальная поддержка, открытый формат, легко редактировать в любом текстовом редакторе.
Минусы: нет стилей (цвета, шрифты, позиции), нет разметки спикеров.
VTT — WebVTT для современного веба
Что это: WebVTT (Web Video Text Tracks) — наследник SRT для HTML5-видео. Поддерживается W3C.
Структура:
WEBVTT
00:00:00.000 --> 00:00:03.200
Привет, как дела?
00:00:03.500 --> 00:00:06.800 line:90% align:start
Нормально, а у тебя?
Похоже на SRT, но с дополнительными возможностями: стили, позиции, метки времени внутри блока.
Когда использовать:
- Веб-плееры HTML5 (тег
<video>+<track>) - Custom-плееры на JavaScript (Plyr, Video.js)
- Современные подкаст-проигрыватели в браузере
Плюсы: мощнее SRT, нативная поддержка в браузерах, можно стилизовать.
Минусы: не везде принимается (старые редакторы не понимают), субтитры YouTube всё-таки лучше в SRT.
Dicto пока не экспортирует VTT — это в roadmap. Конвертация SRT→VTT тривиальна (заменить запятую на точку в таймкоде + добавить заголовок «WEBVTT»).
DOCX — форматированный документ Word
Что это: Microsoft Word документ с разметкой, стилями, таблицами.
Структура в Dicto:
[Заголовок: Транскрипт записи]
[Подзаголовок: Дата записи, длительность]
[Спикер 1, цвет красный] (00:00:00)
Привет, как дела?
[Спикер 2, цвет синий] (00:00:03)
Нормально, а у тебя?
Каждый спикер — отдельным абзацем с цветовой меткой. Таймкоды кликабельные (если открыть в Word и совмещать с аудиоплеером).
Когда использовать:
- Передача клиенту/руководству как готовый документ
- Юридические стенограммы заседаний
- Журналистика — основа для статьи
- Хранение в корпоративной системе документооборота
Плюсы: профессиональный вид, разметка спикеров, можно править в Word.
Минусы: проприетарный формат (хотя docx — открытый стандарт), большой размер файла, не для всех нужен.
Сравнение по сценариям
| Сценарий | Лучший формат |
|---|---|
| YouTube субтитры | SRT |
| HTML5 веб-плеер | VTT |
| Импорт в ChatGPT | TXT |
| Документ для клиента | DOCX |
| Архив в Notion | TXT или DOCX |
| Стенограмма суда | DOCX |
| Premiere Pro / Final Cut | SRT |
| Reels/TikTok burn-in субтитры | SRT |
| Анализ через скрипты | TXT |
Особенности экспорта в Dicto
TXT с таймкодами
По умолчанию TXT в Dicto не содержит таймкодов — это просто текст с разметкой спикеров. Если нужны таймкоды — выбирайте SRT или DOCX. Можно настроить «TXT с таймкодами» в настройках экспорта: тогда формат будет:
[00:00:00] Спикер 1: Привет, как дела?
[00:00:03] Спикер 2: Нормально, а у тебя?
SRT с длиной блока
По умолчанию SRT делает блоки 1-3 секунды (~5-10 слов на блок). Для коротких роликов с большими субтитрами это нормально. Для длинных видео можно настроить блоки 3-5 секунд (~15-25 слов) — меньше мельтешения.
DOCX без цветовой разметки
Если транскрипт идёт в систему документооборота, цветная разметка спикеров может мешать. В настройках экспорта можно отключить цвета — спикеры будут просто bold-текстом.
JSON (в работе)
JSON-экспорт для разработчиков планируется. Формат:
{
"transcript": [
{
"speaker": "Speaker 1",
"start": 0.0,
"end": 3.2,
"text": "Привет, как дела?",
"confidence": 0.97
}
]
}
Это для интеграции с custom workflow — например, если вы строите свой подкаст-сайт с интерактивным транскриптом.
Лайфхаки
1. SRT с длинными блоками — не для всех плееров. YouTube ограничивает до 3 строк по 42 символа. Если в SRT-блоке больше — YouTube обрежет или разобьёт автоматически (часто неудачно).
2. DOCX в Apple Pages — формат может «съесть» цвета спикеров. Лучше открывать в Word или LibreOffice.
3. TXT для AI — добавляйте контекст в начале. Вместо просто текста начните файл с «Это транскрипт интервью с экспертом X на тему Y, дата записи Z» — LLM будет точнее.
4. SRT для Reels — увеличьте размер шрифта в редакторе. Дефолтный размер SRT часто мелкий для вертикальных видео.
5. Конвертация форматов. Если экспортировали в одном формате, а нужен другой — конвертация тривиальна: SRT↔VTT через find-replace, SRT→TXT — отбросить таймкоды, TXT→DOCX — открыть в Word.
Вывод
Нет «лучшего» формата — выбирайте под задачу. Самый универсальный — TXT (работает везде). Самый полезный для видео — SRT. Самый профессиональный — DOCX. Для веб-разработки в перспективе — JSON и VTT.
Попробуйте Dicto бесплатно
Бесплатная проба при регистрации: 30 минут и AI-разбор. Разметка спикеров — без карты.
Начать бесплатно