Пайплайн транскрибации подкаста: от записи до публикации
Подкаст — это не только аудио, но и контент-вселенная: шоу-ноты, статьи, посты, цитаты. Разбираем как AI превращает один эпизод в 10 единиц контента.
Подкаст в 2026 — мультимодальный контент-проект
Современный подкаст — это уже не просто аудиозапись на Apple Podcasts. Полноценный выпуск порождает:
- Audio для подкаст-платформ (Apple, Yandex Music, Spotify, Castbox)
- Видеоверсия для YouTube (с обложкой или говорящими головами)
- Шоу-ноты с тезисами и таймкодами
- Транскрипт для блога с SEO-оптимизацией
- Цитаты для Telegram, VK, Twitter/X
- Короткие клипы для Reels/Shorts/TikTok
- Email-рассылка с краткой версией
Без AI продакшн одного эпизода (60-90 минут) занимает 20-40 часов работы команды. С AI — 5-8 часов. Разбираем полный пайплайн.
Этап 1: Запись (60-90 минут реального времени)
Студия:
- Микрофоны Shure SM7B / Rode PodMic ($300-400)
- Интерфейс Focusrite Scarlett 2i2 ($150)
- Звукопоглощающие панели для комнаты
- Запись в DAW (Adobe Audition, Logic Pro, Reaper)
Remote-запись (гость в другом городе):
- Riverside.fm или SquadCast — записывают локальную дорожку у каждого участника
- Подкаст-ведущему: микрофон + DAW
- Гостю: качественный микрофон + наушники (важно! Иначе будет эхо)
Формат записи:
- WAV 24-bit/48 kHz для архива
- Отдельная дорожка на каждого спикера (для монтажа и diarization)
- Для расшифровки в Dicto подойдёт смесь дорожек в MP3 320 kbps
Этап 2: Монтаж (2-4 часа)
- Удаление длинных пауз, междометий, неудачных дублей
- Балансировка громкости спикеров (compressor + limiter)
- Добавление intro/outro музыки
- Финальный mastering (loudness -16 LUFS для подкастов)
Готовый аудиофайл должен быть финальной версией — расшифровка имеет смысл по той же версии что и публикация.
Этап 3: Транскрибация (5-10 минут с AI)
- 1.Загрузите готовый MP3 в Dicto
- 2.Включите словарь специальных терминов (например для технического подкаста — «микросервис», «API», «Kubernetes», имена ваших постоянных гостей)
- 3.Через 2-3 минуты получите текст с таймкодами
Точность для подкаст-аудио (студийное качество) — 98-99%. Это лучший случай для AI.
Этап 4: Разметка спикеров (2-5 минут)
Diarization автоматически выделит ведущего и гостя. Переименуйте «Говорящий 1» в имя ведущего, «Говорящий 2» в имя гостя. Если в эпизоде несколько гостей (групповой формат) — diarization поддерживает до 10 голосов.
Этап 5: AI-обработка (1 минута)
Нажмите кнопки:
- AI-саммари — текст для описания эпизода на Apple Podcasts (160-200 слов)
- Ключевые тезисы — 5-10 пунктов для буллет-листа в шоу-нотах
- Action items — упомянутые гостем книги, инструменты, ссылки (собираются автоматически в список)
Этап 6: Шоу-ноты для подкаст-платформ (10-15 минут)
Шаблон шоу-нот:
🎙 Эпизод [номер]: [Тема]
Гость: [Имя, должность, заслуги]
📝 В этом выпуске:
• [тезис 1] (00:05:23)
• [тезис 2] (00:18:47)
• [тезис 3] (00:35:12)
📚 Упомянутые в эпизоде ресурсы:
- [книга/инструмент 1]
- [книга/инструмент 2]
🔗 Где найти гостя:
- Twitter/X: @username
- LinkedIn: linkedin.com/in/username
⏱ Таймкоды:
00:00 Введение
05:30 Тема 1
15:00 Тема 2
35:00 Тема 3
50:00 Заключение
AI-саммари и тезисы дают 80% контента шоу-нот. Остальное — копирование таймкодов из транскрипта (один клик в Dicto).
Этап 7: Статья для блога (30-60 минут)
Самый ценный производный контент. Полная статья 1500-2500 слов по эпизоду подкаста.
Промпт для ChatGPT/Claude:
> «Вот транскрипт подкаста с моим гостем [имя]. Напиши статью на 2000 слов в стиле журнала [The New Yorker / Habr / vc.ru] на основе этого разговора. Сохрани ключевые цитаты гостя в прямой речи. Структура: лид, 4-5 разделов H2 с подзаголовками, заключение, CTA на прослушивание подкаста.»
LLM даёт черновик за 30 секунд. Дальше — ручная правка:
- Проверка фактов (особенно цифр и имён)
- Добавление контекста («бэк» из других источников)
- Свой стиль (LLM пишет нейтрально, ваш бренд должен звучать)
- Картинки, цитаты в выделенных блоках
Этап 8: Соцсети (30-45 минут)
Цитаты для Telegram/VK:
Возьмите 5-7 самых мощных цитат из «Ключевые тезисы». Оформите карточками (Canva, Figma). 1 пост = 1 цитата.
Короткие клипы для Reels/Shorts/TikTok:
Выберите 3-5 коротких фрагментов 30-60 секунд из транскрипта (Dicto показывает таймкоды для каждой реплики). Вырежьте в DAV/Premiere. Добавьте SRT-субтитры (экспортируйте из Dicto).
Twitter/X тред:
AI-саммари из Dicto — основа треда. 1 тезис = 1 твит. 5-10 твитов в треде.
Этап 9: Email-рассылка (15 минут)
Подписчики любят получать summary эпизода. Шаблон:
- Тема: «🎙 [Название эпизода] — главные мысли»
- Лид: 2-3 предложения о госте
- 3-5 буллетов из тезисов
- Кнопка «Слушать полный эпизод»
Этап 10: Публикация на платформах (30 минут)
- Apple Podcasts (через хостинг типа Mave, Anchor, Buzzsprout)
- Yandex Music
- Spotify (для русскоязычных подкастов работает)
- YouTube (видеоверсия с обложкой)
- Telegram-канал (репост статьи + ссылка на аудио)
Итоговое время
| Этап | Время | Без AI |
|---|---|---|
| Запись | 60-90 мин | то же |
| Монтаж | 2-4 ч | то же |
| Транскрибация | 5-10 мин | 4-6 часов |
| Разметка спикеров | 5 мин | 30 мин |
| AI-обработка | 1 мин | — |
| Шоу-ноты | 15 мин | 1-2 ч |
| Статья для блога | 30-60 мин | 4-6 ч |
| Соцсети | 30-45 мин | 2-3 ч |
| 15 мин | 1 ч | |
| Публикация | 30 мин | то же |
| ВСЕГО | 5-8 часов | 20-30 часов |
AI экономит 15-22 часа на каждом эпизоде. Для подкастера выпускающего 4 эпизода в месяц — экономия 60-90 часов = 1,5-2 рабочие недели.
Тариф Dicto для подкастера
- Старт (500 ₽/мес за 600 мин) — 4-6 эпизодов по 1,5 часа в месяц
- Про (990 ₽/мес за 1800 мин) — 10-15 эпизодов или более длинные форматы
- Эксперт (1 990 ₽/мес за 4200 мин) — для подкаст-сетей с несколькими шоу
Вывод
Подкастинг — самый «AI-благодарный» формат контента. Один час разговора умножается на 10 единиц производного контента через AI-инструменты. Подкастер из 1 человека в 2026 году делает работу, которую раньше требовала команда из 5 человек.
Попробуйте Dicto бесплатно
Бесплатная проба при регистрации: 30 минут и AI-разбор. Разметка спикеров — без карты.
Начать бесплатно