ИИ умеет не только генерировать картинки и текст, но и транскрибировать аудио. Конечно, нейросети делают это не так хорошо, как люди: придется подправить знаки и некоторые ошибки. Но если нужно расшифровать небольшую запись, а не трехчасовой доклад, то такие сервисы вполне подойдут. Собрали несколько бесплатных нейросетей для расшифровки аудио.
Whisper
Лимиты: на бесплатных моделях нет
Стоимость: 9,99 $ (800 ₽) в месяц за продвинутые модели — более быстрые и качественные
Поддерживает ли русский: да
Приложение для macOS, которое работает на нейросети Whisper от компании OpenAI. Бесплатно доступны две модели, их нужно предварительно скачать. Язык определяется автоматически. Сервис качественно и быстро транскрибирует, расставляет знаки препинания и разделяет текст на абзацы
Riverside
Лимиты: 2 часа аудио
Стоимость: больше — от 15 $ (1400 ₽) в месяц; российской картой не оплатить
Поддерживает ли русский: да
Достаточно перетащить файл на сайт, выбрать один из 100 языков и дождаться транскрибации. Корректно расшифровывает русскую речь и расставляет знаки препинания. Из минусов — не разделяет спикеров в диалоге и не поддерживает популярный формат M4A
Otter.AI
Лимиты: 300 минут в месяц, 30 минут записи разговора за раз
Стоимость: больше — от 8,33 $ (800 ₽) в месяц; российской картой не оплатить
Поддерживает ли русский: нет
Создан для расшифровки онлайн-встреч. Записывать звонки не придется: сервис можно подключить напрямую к Google Meets или Zoom. Разделяет речь спикеров, но поддерживает только английский язык
Salute Speech Bot
Лимиты: до 200 000 символов
Стоимость: от 1000 ₽ в год за дополнительные символы
Поддерживает ли русский: да
Телеграм-бот от Сбера работает на нейросети Salute Speech. В нем можно расшифровывать чужие голосовые сообщения и таким образом заменить ботом функцию из платной подписки Telegram Premium. Недостаток — не до конца расшифровывает длинные сообщения
Teamlogs
Лимиты: 15 минут
Стоимость: дальше — 6 ₽ за минуту
Поддерживает ли русский: да
Онлайн-сервис с интерфейсом на русском. Поддерживает 13 форматов аудио, разделяет речь спикеров, позволяет отредактировать расшифровку перед скачиванием. Дополнительно с помощью ИИ может составить конспект и выделить ключевые слова
Писец
Лимиты: 10 минут бесплатно, потом — расшифровка на низких скоростях
Стоимость: 1290 ₽ за 5 часов быстрой расшифровки
Поддерживает ли русский: да
Сайт разделяет текст до пяти спикеров, расставляет знаки препинания и тайм-коды, но может ошибаться в отдельных словах. С бесплатным тарифом расшифровка иногда занимает несколько часов в зависимости от очереди
👾 Еще больше о нейросетях
В рассылке «Капча». Рассказываем про новые ИИ и полезные сервисы, разбираемся в интернет-культуре, делимся актуальными мемами и трендами
Подписываясь, вы принимаете условия передачи данных и политику конфиденциальности
Что еще можно делать с помощью нейросетей:
- Писать музыку.
- Искать в интернете.
- Генерировать картинки.
Источник: journal.tinkoff.ru