Whisper large-v3 + Gemma на бэке152-ФЗ · хранение в РФ

Видео в текст и структурный конспект — за минуты, а не дни

Загрузите запись встречи, лекции или интервью — получите расшифровку с таймкодами, разбивкой по спикерам, ключевыми кадрами слайдов и готовое саммари в DOCX.

1 час видео → 4–8 минут на GPU 2FA · argon2id · TLS 1.3до 99 языков · автоопределение

Перетащите файл сюда

или нажмите, чтобы выбрать. До 8 ГБ за раз — mp4, mov, mp3, wav и ещё 15 форматов.

mp4movmp3m4awav+15

Загрузка стартует после регистрации — это занимает минуту.

Интерактивный пример

Так выглядит результат — поиграйтесь

Это превью готовой задачи: транскрипт со спикерами, главы по таймкодам и саммари. Кликайте по главе — перематывает. По строке транскрипта — тоже.

meeting-q3-review.mp4
00:00
01:28
Транскрипт
Главы
Саммари
собирается по ходу записи…

Расшифровка вручную — это боль

Если вы хоть раз делали это руками — вы знаете, что это не «час печати». Это полдня выгорания и шесть открытых вкладок.

1 час записи = 4–6 часов работы

Ставите паузу каждые 10 секунд, перематываете, печатаете, расставляете таймкоды.

Бесконечное переслушивание

Шум, пересечённые реплики, акценты. Каждый сложный момент — на третий-четвёртый раз.

Кто что сказал — непонятно

После первой расшифровки идёт второй заход — расставить спикеров, чтобы стало читаемо.

Ошибки и пропуски

К концу второго часа концентрация падает — слова вылетают, термины искажаются.

А потом ещё нужен конспект

Транскрипт — это сырой материал. Чтобы коллеги прочитали — нужен структурный отчёт.

И всё это — каждую неделю

Митап, интервью, лекция, созвон с заказчиком. Цикл повторяется без конца.

Что внутри

Не просто текст. Готовый материал

Девять блоков, которые делают за вас неделю работы и помещаются в одну кнопку «Загрузить».

VAD · large-v3

Точная расшифровка

Whisper large-v3 на GPU: 95–99% по русскому, до 99 языков с автоопределением. Шумы, акценты, плохой микрофон — обрабатываем.

00:00:00 формат

Спикеры и таймкоды

Сегменты с указанием времени для каждой реплики. Кликаете на строку в готовом DOCX — и получаете точку в видео.

smart chapters

Автоматический план

Модель сама находит ключевые моменты, переходы и смысловые блоки. Не пересказ — а каркас встречи или лекции.

vision-AI

Слайды и кадры

Извлекаем кадры на смене сцены, vision-модель описывает что на экране. Готовый альбом скриншотов с подписями.

Gemma 31B

Готовое саммари

Markdown-конспект с разделами, выводами, цитатами и встроенными скриншотами слайдов. Шаблон под встречу или под лекцию.

DOCX · MD · TXT

Экспорт в Word

DOCX с оглавлением, нумерацией страниц, форматированием и встроенными картинками. Сразу в Notion, Word или почту.

ваши шаблоны

Редактируемые промпты

Свой шаблон для саммари, плана, описания слайдов — сохраните для команды. Хотите конспект юриста, продакта, журналиста — настройте один раз.

auto-detect

Многоязычность

99 языков из коробки. Английская встреча с русскоязычными спикерами, французская лекция, китайский подкаст — без переключений.

152-ФЗ

Безопасность

Хранение в РФ, TLS, argon2id, 2FA. Файлы автоматически удаляются через 7 дней. Можно поднять on-premise.

Архитектура пайплайна

Шесть шагов от файла до готового документа

Полностью автоматический конвейер. Кликните по шагу — увидите, что приходит на вход и что уходит дальше.

uploadPresigned PUT · MinIO · TLS 1.3

1. Загрузка

Файл идёт в зашифрованное S3-совместимое хранилище через временный presigned-URL — браузер пишет напрямую, без посредника.

Вход
  • mp4 / mov / mp3 / wav
Выход
  • uploads/{uuid}.mp4
Сценарии применения

Восемь профессий, которые экономят дни

Один продукт — разные сценарии. Шаблоны саммари настроены под каждый.

Встречи и созвоны

продакты, тимлиды, менеджеры

было

Запись 1 ч × 4 встречи в день — некогда писать конспекты

стало

Конспект встречи сам приходит в почту через 6 минут после её окончания

6 мин на 1 часдо спикеровавтодействия

Лекции и обучение

преподаватели, EdTech, корпоративные тренеры

было

Курс из 30 видео нужно превратить в текст для проверки и LMS

стало

Готовая методичка с тезисами, цитатами и скриншотами слайдов

шаблон лекциислайдыглоссарий

Подкасты и интервью

ведущие, продюсеры, авторы

было

Расшифровка 90-минутного выпуска на фрилансере — 5–7 тысяч и 3 дня

стало

Текст с таймкодами и саммари за полчаса. SEO-описание, цитаты, нарезка по гостям

цитатыSEOсоцсети

Журналистика и медиа

корреспонденты, редакторы, документалисты

было

Часовое интервью + дедлайн через два часа — невозможно

стало

Полная расшифровка с пометкой спикеров за 5 минут. Редактируйте, цитируйте, публикуйте

дедлайнточные цитатыархив

Юристы и адвокаты

юрфирмы, адвокатские бюро, нотариусы

было

Запись допроса/совещания нужно перенести в протокол с точными формулировками

стало

Дословная расшифровка с таймкодами. 152-ФЗ, хранение в РФ, 2FA, удаление по расписанию

152-ФЗточноархив

Исследователи и UX

UX, soc-research, медицинские интервью

было

20 респондентов × час — это 60 часов чистой расшифровки

стало

Все интервью обрабатываются параллельно. На выходе — текст и саммари по каждому, готовое для тегирования

параллельтегированиеAPI

Отделы продаж

B2B-сейлзы, КАМ-менеджеры, успех клиентов

было

Звонки клиентам не разбирают — теряются возражения и инсайты

стало

Разбор каждого звонка по схеме: возражения, потребности, договорённости. Менеджер видит свои паттерны

возражениядоговорённостикоучинг

Корпоративные клиенты

HR, банки, госкорпорации

было

Данные не должны уходить наружу. Нужна интеграция и единый аудит

стало

On-premise или приватный VPС. API для интеграции с 1С, Битрикс, ваш ERP. SSO, RBAC и журналы

on-premiseAPIRBAC
Тарифы

Понятная цена. Минуты не сгорают

Без подписочного автосписания. Платите за месяц вперёд — не понравится, не продлите. Перерасход — по убывающей шкале на старших планах.

Free
Попробовать без оплаты
0₽/мес
Минут в месяц60
Макс. файлдо 30 мин
Модельsmall
  • Транскрипция + таймкоды
  • Автосаммари (Markdown)
  • Экспорт в DOCX
  • Слайды и описания кадров
  • Без водяного знака
  • Приоритет в очереди
Начать бесплатно
Starter
Для регулярных встреч и лекций
690₽/мес
1.7 ₽/мин
Минут в месяц400
Макс. файлдо 90 мин
Модельmedium
  • Транскрипция + таймкоды
  • Автосаммари (Markdown + DOCX)
  • Экспорт в DOCX
  • Слайды и описания кадров
  • Без водяного знака
  • Приоритет в очереди
Выбрать Starter
Хит
Pro
Для контента в потоке
1 490₽/мес
1.0 ₽/мин
Минут в месяц1500
Макс. файлдо 240 мин
Модельlarge-v3
  • Whisper large-v3 (макс. точность)
  • Автосаммари (Markdown + DOCX)
  • Экспорт в DOCX
  • Слайды и описания кадров
  • Без водяного знака
  • Приоритет в очереди + GPU
Выбрать Pro
Business
Команда, API, счета
3 900₽/мес
0.8 ₽/мин
Минут в месяц5000
Макс. файлдо 480 мин
Модельlarge-v3
  • Всё из Pro
  • REST API + webhook
  • До 3 участников команды
  • Кастомные шаблоны саммари
  • Закрывающие документы
  • Приоритетная поддержка
Выбрать Business
Калькулятор

Сколько часов в месяц вам нужно?

Подвиньте слайдер — мы подсветим план под ваш объём и сразу посчитаем перерасход. Тариф годовой даёт −20% к месячной части.

8 ч
25ч50ч75ч100ч
Минут в месяц
480
Подходит план
Pro
Цена/мес
1 490 ₽
Лимит плана (1 500 мин) покрывает ваш объём — без перерасхода.
Итого/мес
1 490
Перейти к Pro≈ 3.1 ₽/мин эффективно
Сравнение

Что есть у нас и чего нет у других

Открытое сравнение по 24 параметрам — то, что важно для русскоязычной команды.

ВозможностьKROKKI.RUOtter.aiTranskriptorYandex SK
Whisper large-v3
Точность RU 95%+
99 языков
Спикеры и таймкоды
Шумоподавление и VAD
Отзывы

Что говорят те, кто уже встроил в работу

Журналисты, продакты, юристы, исследователи — каждый берёт свой шаблон саммари.

АК
Анна Кравцова
Журналист, «Ведомости»

«Беру три-четыре интервью в неделю. Раньше тратила полдня на расшифровку — теперь за 10 минут на каждое получаю текст с таймкодами и сразу выбираю цитаты. Дедлайн в день — теперь это норма, а не подвиг.»

интервью · 90 мин в неделю
Безопасность

Ваши записи не уйдут никуда

Архитектура спроектирована так, чтобы соответствовать требованиям юристов, банков и медицины. Один файл — один тенант, ничего не пересекается.

Хранение в РФ

Файлы и метаданные на серверах в России. 152-ФЗ выполняется по умолчанию, без галочек и доплат.

TLS и argon2id

Все каналы — TLS 1.3. Пароли — argon2id, устойчивый к перебору на GPU. Refresh-токены — в HttpOnly Secure cookie.

2FA и backup-коды

TOTP по RFC 6238 (Google Authenticator, 1Password). 8 одноразовых backup-кодов на случай потери устройства.

Авто-удаление

Загруженные файлы удаляются через 7 дней. Артефакты — по запросу или с настраиваемым сроком хранения.

Прозрачный аудит

Каждая сессия пишет user-agent, IP и время. Журнал доступен в личном кабинете — видно, кто откуда заходил.

On-premise

Для корпоратов — поднимаем в вашем VPC или дата-центре. Без интернета и без выхода данных наружу.

Частые вопросы

На что обращают внимание до покупки

Если что-то осталось без ответа — напишите, отвечаем в течение 2 часов.

Полный список: mp4, mov, mkv, webm, avi, m4v, mpg, mpeg, ts, 3gp, wmv, flv для видео и mp3, m4a, aac, wav, flac, ogg, opus, wma для аудио. Лимит размера — 8 ГБ за один файл. Если у вас другой формат, конвертируйте в mp4 любым онлайн-конвертером — это занимает минуту.
Базовая точность по русскому — 95–99%. Зависит от качества микрофона, шумов, акцентов и количества спикеров. На студийной записи — близко к 99%, на телефонном конференц-звонке с шумом — около 92–95%. Мы используем Whisper large-v3 на старших тарифах и medium на Starter — это лучшее, что есть в open-source на сегодня.
На GPU (Pro/Business): 4–8 минут. На CPU (Free/Starter): 25–35 минут. Дальше идёт сборка плана, описание слайдов и саммари — ещё 30–90 секунд. Для больших файлов работает параллельно: при загрузке нескольких записей одновременно они обрабатываются в очередь.
Файлы хранятся в S3-совместимом хранилище в РФ. Канал — TLS 1.3. Пароли — argon2id. По умолчанию загруженные файлы удаляются через 7 дней, артефакты — по запросу или по расписанию. Нигде не публикуем, не используем для обучения моделей и не передаём третьим лицам. Для юристов, банков и медицины есть on-premise — поднимаем у вас в контуре.
Да. После обработки вы открываете задачу — там полный транскрипт с таймкодами, план с миниатюрами слайдов и саммари в Markdown. Можно править текст, передвигать пункты плана, добавлять/удалять слайды и заново сгенерировать саммари с другим промптом. Все версии сохраняются — можно откатиться.
Минуты не сгорают в течение оплаченного периода. Если вы не использовали 200 из 400 минут на тарифе Starter — они доступны до конца месяца. После — обнуляются (это стандартная практика всех SaaS). На годовом тарифе — 12 порций ежемесячно, без переноса между месяцами.
Только если вы сами включили автопродление при оплате (галочка). По умолчанию — разовый платёж за месяц или год. По истечении — план опускается до Free. Никаких сюрпризов с картой, никаких скрытых триалов с автоконвертацией.
Да, на Pro и Business: REST с presigned-upload, polling задач, Server-Sent Events для прогресса в реальном времени и webhook'и при завершении. Готовая интеграция с Notion, Telegram, 1С — через webhook + ваш middleware. Документация и Postman-коллекция — по запросу.
Да, для Business и enterprise. Поднимаем в вашем дата-центре или приватном облаке: api + worker (с GPU или без), Postgres, Redis, MinIO. Развёртывание через docker-compose или k3s/Helm. Лицензия — годовая, обновления и сапорт включены.
Да. В транскрипте каждый сегмент помечен спикером. Модель различает голоса по тембру и переходам — на чистой записи 2–4 спикеров точность около 95%. Можно вручную переименовать в личном кабинете: «Спикер 1» → «Иванов», и это применится к финальному документу.

Перестаньте слушать записи. Читайте конспекты.

За 5 минут зарегистрируетесь, загрузите видео и получите готовый документ. Если не понравится — просто не продлевайте, никто ничего не спишет.

  • 60 минут бесплатно — без карты
  • Без автосписаний и подписочных трюков
  • Шаблоны под встречи, лекции, интервью
  • Российский провайдер, 152-ФЗ