ИИ проговорят текст разными голосами.
Конечно, нейросети не заменят профессиональную живую озвучку, но помогут в несложных задачах. Почти во всех сервисах можно найти приятный голос, который не похож на типичного робота.
Я протестировала онлайн-сервисы, которые поддерживают русский язык. Для чистоты эксперимента все проговаривали один и тот же текст про котенка. Оценивала по пятибалльной шкале.
Бесплатные нейросети для озвучки текста
- ElevenLabs
- Narakeet
- Robivox
- Murf
- Voicer
- Freetts
- Apihost
- Zvukogram
ElevenLabs
Качество озвучки: 📣📣📣📣📣
Лимит: один текст — до 5 тысяч символов, всего 10 тысяч символов
Платные функции: больше — от 5 $ (478 ₽) в месяц, российской картой оплатить нельзя
Цены в рублях пересчитываются по актуальному курсу каждый раз, когда вы открываете страницу
Так выглядит сервис ElevenLabs внутри
ElevenLabs — крупнейшая площадка, которая специализируется на создании ИИ для синтеза речи. Их нейросети используют для озвучки аудиокниг, дубляжа видео и создания голосовых ассистентов. Сайт доступен только через иностранный IP-адрес.
Чтобы генерировать на русском, выберите режим Advanced и модель Eleven Multilingual v2. В ней доступно 17 голосов, которые поддерживают 29 языков, они распознаются автоматически. Перед генерацией есть несколько настроек:
- Similarity — насколько близко генерируемая речь должна быть к образцу голоса;
- Style Exaggeration — насколько выразительной должна быть речь. Может быть полезно для озвучки героев мультфильмов;
- Speaker boost — тумблер усиливает характеристики голоса.
Вариант голоса можно выбрать по клику на выпадающее меню, там же можно послушать примеры. После ввода текста нажмите Generate speech — результат будет готов через несколько секунд. Чтобы скачать, нажмите на кнопку сохранения. Сервис сразу покажет, сколько символов у вас осталось.
Результат ElevenLabs
Голоса очень живые и звучат как актеры озвучки аудиокниг. Каждый читает будто с нужными эмоциями, интонацией и паузами.
Но у некоторых есть странные нюансы. Например, голоса Callum и Alice читают знак «—» как букву «А». Chris вообще прочитал знак тире на каком-то другом языке.
👍 Плюсы:
- Простой и удобный сайт.
- Живые голоса.
- Щедрые лимиты.
👎 Минусы:
- Некоторые голоса странно читают знаки и буквы.
Narakeet
Качество озвучки: 📣📣📣
Лимиты: за раз — один абзац текста, бесплатно — всего 20 попыток
Платные функции: чтобы снять лимиты, нужно купить пакет минут — он стоит от 0,05 $ (4 ₽) за минуту, оплатить российской картой нельзя
Интерфейс Narakeet
Narakeet предлагает не только озвучку текста, но и инструменты для создания видео. Например, можно написать сценарий, а сервис автоматически озвучит его с помощью разных голосов и добавит изображения.
Чтобы озвучить текст, достаточно ввести его в поле для ввода или загрузить файл. Лимиты жесткие: 1 Кб текста — это примерно 1000 символов. Если указать в тексте ударения, то сервис это учтет.
Результат из Narakeet
Предварительно можно послушать, как звучат голоса. Русскоговорящих всего 24, но они роботизированные — не хватает выразительности и эмоциональности. Из всех мне понравились только три: Ольга, Владимир и Галина. Помимо голоса по кнопке «Больше опций» можно настроить параметры: выбрать громкость, скорость и формат аудио — M4A, MP3, WAV.
Сервис подойдет, если нужно озвучить несколько коротких отрывков, а требований к качеству голоса нет. Если попытаться загрузить большой файл, то Narakeet предложит оплатить подписку.
👍 Плюсы:
- Много голосов на выбор.
- Легко использовать.
👎 Минусы:
- Роботизированные голоса.
- Жесткие лимиты.
- Мало настроек.
Robivox
Качество озвучки: 📣📣📣📣
Лимиты: 10 минут аудио
Платные функции: больше — от 2,7 ₽ за минуту
Ниже плашки с текстом появится кнопка «Синтезировать речь»
Минималистичный российский сервис. Можно выбрать из 10 разных голосов, настроить скорость, расставить паузы и ударения. Доступны обычные и про-голоса. Последние отличаются тем, что звучат более эмоционально и естественно.
Бесплатный курс Учебника Т—Ж «Как упростить жизнь с помощью нейросетей»
Изначально сервис предлагает озвучить только 100 символов — это очень мало, примерно одно предложение. После регистрации вам начислят 5 бонусных рублей, которых хватит на 10 минут аудио обычным и 2 минуты про-голосом.
Рекомендую про-голос Дмитрия — его приятно слушать, он похож на человека и делает паузы в нужных местах. Из обычных приемлемо звучат Алиса и Джейн, хотя они достаточно роботизированные.
Результат из Robivox
Чтобы озвучить текст, скопируйте его в поле, выберите голос и настройки, а потом нажмите «Синтезировать речь». Результат сохраняется в MP3 или WAV.
Мне понравились премиум-голоса — звучат очень естественно и живо. Даже без платной подписки сервис можно использовать, чтобы озвучить небольшой ролик для соцсетей.
👍 Плюсы:
- Легко использовать.
- Есть настройки паузы и ударений голоса.
👎 Минусы:
- Жесткие лимиты.
- Мало бесплатных голосов.
Murf
Качество озвучки: 📣📣📣📣
Лимиты: до регистрации есть ограничение в 250 символов, после регистрации сервис дает 10 минут, которые тратятся каждый раз после озвучки текста
Платные функции: за 19 $ (1816 ₽) в месяц сервис дает 24 часа озвучки, российской картой оплатить нельзя
Так выглядит интерфейс Murf
Сервис просит создать аккаунт, чтобы бесплатно озвучить текст с настройками. После регистрации появляется возможность использовать 4 русских голоса — 2 мужских и 2 женских.
Чтобы озвучить, выберите язык и голос, вставьте текст и нажмите Play. Внутри сервиса удобно сравнивать результаты друг с другом — можно создавать блоки, выбирать хоть 10 голосов сразу и слушать по очереди.
После озвучки сервис предлагает скачать один или сразу все 10 файлов, выбрать канал, качество и формат: MP3, WAV, FLAC, A-LAW, μ-LAW. Но результат можно сохранить только после оплаты подписки.
10 бесплатных нейросетей для создания музыки и песен
Из настроек есть: высота, скорость, паузы. Также в личном кабинете можно сохранять голоса в избранное. Мне показалось, что сервис больше подходит для личного использования. Например, прочитать анекдот и отправить это друзьям или поиграться с настройками голоса и понять, что вам нравится.
Более натурально и живо звучат Владимир и София. Вместе с этим их голоса похожи на дикторские, поэтому создается ощущение, что ты слушаешь чтение книги перед сном. Иван и Ирина, напротив, читают довольно роботизированно. В их голосе слышится такой звук синтеза, который выдает робота.
👍 Плюсы:
- Живые и зрелые голоса.
- Много настроек.
👎 Минусы:
- В бесплатной версии нельзя сохранить результат.
- Мало русских голосов.
- Сервис просит создать аккаунт.
Voicer
Качество озвучки: 📣📣📣📣
Лимиты: за раз — один абзац текста, бесплатно — только одна попытка
Платные функции: от 3,9 $ (372 ₽) за 50 тысяч символов, чтобы увеличить количество символов, нужно купить подписку
Так выглядит интерфейс Voicer
В бесплатной версии есть ограничения только на озвучку. Максимальный размер текста — 1000 символов, а еще у голосов нет эмоциональной окраски. Это значит, что они будут озвучивать текст нейтрально, даже если поиграться с функционалом. Например, можно поменять бас, эхо, скорость, высоту, частоту и громкость.
Можно использовать 20 бесплатных голосов, среди которых есть 3 более-менее интересных — Оксана, Александр и Владислав. Как мне кажется, они звучат лучше остальных за счет интонации.
Чтобы озвучить, пишите текст, меняйте настройки будущего голоса и нажимайте «Озвучить». Результат можно скачать в MP3, WAV, OGG.
Результат из Voicer
Если вы хотите пойти дальше и работать с более длинными текстами, а еще и добавлять к ним эмоции, придется зарегистрироваться. Правда, после сервис попросит вас оплатить хотя бы минимальное количество символов, чтобы озвучить текст. Из интересного — можно сохранять голоса в избранное и менять их эмоцию. Доступно всего два варианта: Neutral и Robot.
Голоса на сайте звучат сыро. Многим сложно придумать применение. Но если вы разбираетесь в музыке и голосе, наверное, сможете классно его настроить. Я совсем не разбираюсь в басах и высоте озвучки, поэтому не смогла настроить голос приемлемо.
👍 Плюсы:
- Много бесплатных голосов.
- Есть разные настройки голоса — от скорости до баса и эхо.
👎 Минусы:
- В бесплатной версии у голосов нет эмоций.
Freetts
Качество озвучки: 📣📣📣📣
Лимиты: за раз — 2000 символов, количество попыток — бесконечное
Платные функции: нет
Простой интерфейс Freetts
Полностью бесплатный российский сервис. Озвучивать можно сколько угодно, есть только ограничение на количество символов за одну попытку. Однако за это придется заплатить качеством — голоса достаточно роботизированные.
Всего доступно 29 русскоязычных голосов. Они достаточно разнообразны, текст озвучивается без ошибок и даже с правильной интонацией, но сильно ощущается неестественность. Есть даже отдельный Максим-бот, чей голос вам точно знаком по сотням роликов с YouTube и TikTok. Мои фавориты — Захар, Полина, Дария.
Результат в Freetts
Чтобы озвучить текст, скопируйте его в поле, выберите голос и нажмите «Преобразовать в речь». Никаких дополнительных настроек нет. Результат можно скачать только в MP3.
Мне понравилась минималистичность и отсутствие рекламы. Идеально подходит для озвучки мемов или забавных видео, тем более что прогонять текст можно бесконечно.
👍 Плюсы:
- Большой выбор голосов.
- Легко использовать.
- Нет рекламы и платных подписок.
👎 Минусы:
- Роботизированные голоса.
- Нет никаких настроек.
Apihost
Качество озвучки: 📣📣📣
Лимиты: от 500 до 1000 символов
Платные функции: от 0,6 ₽ за 1000 символов
Панель с кучей настроек Apihost
Российский сервис с семью версиями нейросети, которые различаются лимитом по символам и количеством голосов. Например, в V1 — 1000 символов и 17 голосов, в V2 — уже 500 символов и 20 голосов. Модели различаются по качеству генерации, набору эмоций, скорости обработки.
Предварительно можно задать настройки: сделать голос нейтральным, дружеским или раздраженным. А еще выбрать высоту, скорость и длину паузы. Если хотите получить хорошую озвучку, обязательно ставьте ударения и знаки препинания. Без них не будет интонации и пауз.
Результат из Apihost
Чтобы озвучить текст, напишите или скопируйте его, выберите настройки и нажмите «Озвучить». Результат можно скачать в MP3 и WAV. Не рекомендую регистрироваться на сайте, потому что Apihost сразу потребует оплатить подписку. Бесплатные попытки доступны только без регистрации.
Понравилось, что сервис позволяет изменять голос как угодно — делает его детским или, наоборот, чересчур роботизированным. Однако из-за лимитов и постоянного требования оплатить подписку пользоваться им неудобно.
👍 Плюсы:
- Много настроек голоса — от скорости до высоты.
- Есть живые голоса и суперроботизированные.
👎 Минусы:
- Жесткие лимиты.
Zvukogram
Качество озвучки: 📣📣📣📣
Лимиты: 10 тысяч символов
Платные функции: от 150 ₽ за 30 тысяч символов
Так выглядит интерфейс Zvukogram
Российский сервис с огромным количеством разных голосов. Создатели предлагают использовать Zvukogram для озвучки ютуб-видео, бизнес-презентаций или сказок.
Действует система токенов. За один токен можно озвучить 1000 символов обычным голосом либо около 200 символов про-голосом. На сайте есть таблица, где сравниваются разные свойства голосов — интонация, эмоции, скорость.
Есть в том числе платные варианты: у них более высокая средняя оценка сообщества и больше опций для естественной имитации речи. Но мне показалось, что обычные голоса не звучат сильно хуже премиума. Мои фавориты — Денис, Катя, Оксана.
Результат Zvukogram
Без регистрации доступно пять токенов, после регистрации выдают десять. Однако они не суммируются, поэтому лучше сначала потратить первые пять, потом уже регистрироваться.
Чтобы озвучить текст, введите его в поле, выберите язык, голос и настройки — высоту, частоту, паузу предложений, параграфов и скорость. Под полем для ввода есть подробные инструкции, как размечать текст, — воспользуйтесь ими. Можно даже сгенерировать диалог между разными голосами. Нажмите на «Озвучить текст».
Токены будут списываться с баланса в реальном времени, так что вы сразу можете понять, на сколько озвучек вам хватит. Результат можно скачать в MP3, WAV, OGG, OPUS.
Сервис идеально подходит для озвучки сообщений и шуток. Если озвучивать небольшие тексты, то десяти токенов хватит надолго.
👍 Плюсы:
- Можно использовать для озвучки видео.
- Можно озвучить большие тексты.
👎 Минусы:
- Мало бесплатных голосов.
- Сложная система с токенами.
Мы постим кружочки, красивые карточки и новости о технологиях и поп-культуре в нашем телеграм-канале. Подписывайтесь, там классно: @t_technocult
Источник: journal.tinkoff.ru