10 бесплатных нейросетей для создания музыки и песен

Генерировать музыку теперь так же легко, как картинки или текст.

Все сервисы доступны онлайн, а в большинстве достаточно написать текстовый запрос или просто выбрать жанр и настроение. Нейросеть сама подберет инструменты и напишет мелодию. А некоторые даже могут сочинить стихи и пропеть их.

Я протестировала 10 сервисов на одной и той же задачи: придумать незамысловатую веселую композицию для рекламы йогурта.

Нейросети для генерации музыки

Suno AI
Udio
Music.fy
Riffusion
Voicemod
Mubert
Media.io
Soundraw
Boomy
Loudly

Suno AI

Качество генерации: 🎵🎵🎵🎵🎵
Что умеет: генерировать песни с вокалом по текстовому запросу, редактировать треки
Лимиты: 50 кредитов хватает на пять попыток
Платные функции: больше кредитов от 10 $⁣ (878 ₽) в месяц, но российской картой оплатить нельзя

Цены в рублях пересчитываются по актуальному курсу каждый раз, когда вы открываете страницу

Интерфейс Suno

Сервис прост в использовании: пишете промпт на русском или английском языке, нажимаете Create и получаете полноценную песню с вокалом.

Генерация занимает пару минут. По одному запросу нейросеть выдаст два варианта с разным текстом и аранжировкой. Каждая длится полторы минуты.

Suno AI: как пользоваться нейросетью для генерации песен

В текстовом запросе можно прописать настроение и жанр или указать, о чем должна быть песня. Нейросеть понимает имена реальных музыкантов — например, сочинит песню в стиле Аврил Лавин. Правда, работает это не всегда, поскольку по идее так делать нельзя — голоса артистов защищены авторским правом.

Оба моих сгенерированных варианта звучали удачно, только на русском языке были проблемы с рифмой. Мне понравился трек «Йогуртовая мечта» — название тоже придумала нейросеть. Мотив запоминающийся, песня надолго засела у меня в голове. А больше для хорошего джингла ничего и не нужно.

Песня «Йогуртовая мечта»

Suno может не только придумать текст, но и исполнить ваш. Функция идеально подойдет для озвучивания переписок или мемных текстов. Для этого нужно перейти в раздел Create, нажать переключатель Custom, в поле Lyrics написать текст, в а в поле Style of Music указать на жанр трека.

Нейросеть также позволяет редактировать песни по кнопке Extend возле сгенерированного трека. Сервис добавит еще сегмент. Таким образом можно заменить неудачную часть или дописать куплет в конец.

Бесплатный курс Учебника Т⁠—⁠Ж «Как упростить жизнь с помощью нейросетей»

В целом Suno отлично генерирует музыку. Голоса похожи на настоящие, тексты на русском языке качественные, а мелодию сложно отличить от написанной людьми. Приятный бонус — для каждого трека нейросеть предлагает сгенерированный вариант обложки.

Udio

Качество генерации: 🎵🎵🎵🎵
Что умеет: генерировать песни с вокалом или инструментальную музыку по текстовому запросу
Лимиты: 10 кредитов в день хватит на пять песен
Платные функции: больше кредитов от 10 $⁣ (878 ₽) в месяц, но российской картой оплатить нельзя

Интерфейс Udio

Сервис специализируется на точечной настройке запроса перед генерацией песни. Можно уточнить жанр, инструменты, темп и настроение композиции, нажав на соответствующие кнопки под строкой ввода промпта. Если не хочется разбираться, то есть возможность просто описать будущий трек.

Udio умеет генерировать инструментальную музыку и песни с вокалом. Для первого варианта нужно выбрать опцию Instrumental. Чтобы нейросеть сама придумала текст песни — Auto-generated, а чтобы написать свой — Custom.

Как бесплатно сгенерировать качественную песню в нейросети Udio

Я не ограничивала нейросеть параметрами и на русском языке попросила сочинить песню для рекламы йогурта. Жанровые теги прописались автоматически — сервис выбрал диско и танцевальную музыку.

ИИ сгенерировал два варианта, каждый запрос расходовал два кредита. Помимо 10 кредитов в день мне дали выдали 100 бонусных на месяц — достаточно щедро, этого хватит на 50 треков.

Первая песня получилась в жанре поп-музыки, но половину слов было не разобрать. Вторая в стиле диско оказалась удачнее. Смутило, что трек очень резко обрывался на полуслове. Дело в том, что сервис создает только 30-секундные треки.

Песня «Сочный старт»

Пришлось редактировать песню. Для этого возле сгенерированного трека я открыла меню по кнопке Extend, добавила фрагмент в конец и проигрыш в начало. А еще исправила сгенерированный текст.

В Udio много возможностей повлиять на результат: как задавать изначальный промпт, так и редактировать получившуюся песню. Однако качество генерации на русском иногда хромает. Некоторые слова сливаются, получается каша. Но если разобраться в настройках, то можно добиться хорошего результата.

Music.fy

Качество генерации: 🎵🎵🎵🎵
Что умеет: перепевать песни голосами известных исполнителей или героев поп-культуры
Лимиты: три бесплатные генерации в час
Платные функции: больше генераций и голосов исполнителей от 9,99 $⁣ (878 ₽) в месяц, но российской картой оплатить нельзя

Часть доступных голосов для создания каверов на Musicfy

Нейросеть не умеет генерировать песни с нуля, а только позволяет заменить голос в уже существующем треке. Таким образом, можно пропеть любую песню голосом Эминема или Губки Боба.

У меня был готов трек для рекламы «Йогуртовая мечта», сгенерированный в нейросети Suno AI, о которой я рассказывала выше. Я разделила эту песню на а капелла и минус на сайте x-minus. Первую звуковую дорожку загрузила на music.fy.

После загрузки трека можно выбирать голос исполнителя для будущего кавера. На сайте доступна большая библиотека: есть вокалы Кэти Перри, Арианы Гранде, Гарри Стайлза, Кендрика Ламара, Ланы Дель Рей и других поп-звезд и рэперов. Есть и персонажи мультфильмов — например, Шрека или Микки Мауса. Они все могут петь на русском языке.

Для своей песни я выбрала голос Билли Айлиш. После этого я нажала Convert, дождалась обработки и скачала файл. Чтобы получить готовый трек, я совместила сгенерированную капеллу с минусом в онлайн-сервисе veed.io.

Русскоговорящая Билли Айлиш поет про йогурт

Голос оказался не очень похожим на Айлиш. Вероятно, основное сходство потерялось из-за того, что песня на русском языке, а мелодия слишком ритмичная. Чтобы получить более качественный вариант, можно воспользоваться аналогичной нейросетью so-vits-svc, но придется разбираться с сервисом Google Collab.

Хотя сервис и не генерирует саму музыку, с ним можно делать смешные мэшапы для соцсетей. Мне даже захотелось оформить платную подписку, чтобы поэкспериментировать с другими голосами артистов.

Riffusion

Качество генерации: 🎵🎵🎵🎵
Что умеет: генерировать песни с вокалом по текстовому запросу или картинке
Лимиты: нет
Платные функции: нет

Одна из сгенерированных песен в приложении

Приложение на iOS и Android умеет генерировать песни на английском языке. Сервис может сочинить текст сам или пропеть ваш. Для создания треков на главном экране три режима — Camera, Compose и Prompt.

Вкладка Camera позволяет генерировать текст по картинке. Снимок можно сделать прямо из приложения. Нейросеть споет буквально о том, что изображено. Например, если сфотографировать натюрморт с фруктами и йогуртом, то нейропевец перечислит их и опишет вкус — и все это в рифму.

Режим Compose позволяет отдельно написать текст песни на вкладке Lyrics и отдельно запрос для генерации мелодии на вкладке Sound. Если нажать на кнопку Write for me, то сгенерируется случайный текст песни. При вводе промпта для мелодии можно нажимать на случайные теги вместо того, чтобы прописать самому.

Вкладка Prompt сгенерирует и мелодию, и стихи по одному текстовому запросу. В нем я описала, о чем будет мой трек. Я пробовала указать Тейлор Свифт, но нейросеть отказывается генерировать голос конкретных артистов. Мне предложили альтернативный вариант: кантри-поп-певица и инди.

В итоге сгенерировалась бесконечная лента из 30-секундных песен, которые можно пролистывать друг за другом, чтобы послушать.

Я выбрала такую

Проигрываются они автоматически. Чтобы расширить понравившийся трек, нужно нажать Edit → Add Sound и написать текстовый запрос для нового сегмента. Любую композицию можно сохранить или поделиться ею в соцсетях.

Треки получились достаточно приятными и с длинными проигрышами. Нейросеть не боится экспериментировать с голосами. В ленте из каверов по одному и тому же запросу можно найти несколько разнообразных и интересных вариантов.

Voicemod

Качество генерации: 🎵🎵🎵
Что умеет: перепевать песни на разный манер
Лимиты: нет
Платные функции: нет

Персонажи, голосами которых может петь нейросеть

Небольшой сервис для озвучки, который создатели называют «мем-машина», намекая, что он походит для создания забавных роликов для соцсетей. Процесс генерации простой и занимает всего три шага.

Сначала я выбрала музыкальное сопровождение из 15 готовых мелодий. Затем — голос персонажа. Всего доступно семь шаблонов голосов, четыре женских и три мужских. Все можно предварительно прослушать.

На третьем шаге мне предложили написать текст песни на английском. Пришлось уложиться примерно в 320 символов. Затем я нажала на кнопку Create song и скачала результат в формате видео со статичной картинкой.

Вот что получилось

Результат получился забавным. Сгенерированные треки в Voicemod можно использовать, например, для создания видеооткрыток с персонализированными поздравлениями.

Из плюсов — отсутствие лимитов, можно генерировать бесконечно. Из минусов — иногда вокал звучит неестественно, будто поет робот.

Mubert

Качество генерации: 🎵🎵🎵
Что умеет: генерировать инструментальную музыку по текстовому запросу или картинке
Лимиты: не более 30 минут в день, до 25 треков в месяц
Платные функции: больше генераций и возможность скачивать треки без потери качества от 14 $⁣ (1230 ₽) в месяц, но российской картой оплатить нельзя

Интерфейс Mubert

Mubert генерирует только инструментальную музыку на основе собственной библиотеки семплов. Чтобы создать песню, достаточно написать текстовый запрос на английском языке или выбрать настроение, жанр и стиль. А после этого указать длительность и тип песни — трек, джингл, луп или микс.

Запросом может быть не только текст, но и изображение. Нейросеть проанализирует картинку и создаст подходящий по смыслу трек. В теории можно узнать, как звучат кадры из фильмов или произведения искусства. Однако по снимку йогурта нейросеть создала странную и роботизированную мелодию, которая вряд ли хоть как-то ассоциируется с рекламой.

С текстовым запросом «a song for yogurt ad» сервис справился гораздо лучше.

Песня для рекламы йогурта из Mubert

Мне кажется, что сгенерированную мелодию вполне можно использовать в проморолике. Жаль только, что в сервисе нельзя добавить вокал.

Из-за большого выбора жанров Mubert — хороший вариант для генерации фоновой музыки для роликов в соцсетях. Но генерировать песни по картинкам точно не получится.

Media.io

Качество генерации: 🎵🎵🎵
Что умеет: генерировать инструментальную музыку по текстовому запросу или жанру
Лимиты: всего четыре бесплатных трека
Платные функции: больше кредитов от 9,99 $⁣ (878 ₽) в месяц, но российской картой оплатить нельзя

Интерфейс media.io

Media.io — сервис со множеством ИИ-функций, от улучшения качества фото до изменения голоса. Одна из них — генератор инструментальной музыки. Создавать песни можно по жанру — хип-хоп, рок, акустика, — настроению — счастливое, грустное, романтичное — или теме — реклама, трейлер, влог, занятия спортом. Либо написать текстовый запрос на английском языке.

Лимиты жесткие: только два трека по текстовому запросу и два трека по жанру длительностью до 5 минут. Для своей задачи я выбрала жанр Acoustic, настроение Happy, тему Ads & Trailers. Продолжительность — 1 минута. Получилась приятная мелодия, которую можно использовать для рекламы или влога на «Ютубе».

Мелодия про йогурт

Если составлять текстовый запрос, то сервис дает подсказки. Есть библиотека промптов. Вот что у меня вышло: a song about yogurt for advertising, dynamic, cheerful, rhythmic. Однако результат оказался хуже, чем при генерации по тегам. Вместо милой мелодии я получила музыку для остросюжетного фильма.

Нейросеть подойдет, если нужны простые фоновые композиции. Для задач посерьезнее не рекомендую, поскольку на результат сложно повлиять и нет возможности добавить вокал.

Soundraw

Качество генерации: 🎵🎵
Что умеет: генерировать инструментальную музыку по заданным параметрам
Лимиты: нет, но бесплатно треки скачать нельзя
Платные функции: 16,99 $⁣ (1493 ₽) за возможность скачивать треки и дополнительные функции, но российской картой оплатить нельзя

Так выглядит редактор внутри Soundraw

На главном экране предлагают выбрать параметры для будущего трека: длительность, темп, жанр, настроение и тематику — мелодия для свадебного видео, документального кино, рекламы, трейлера или влога. Можно отметить галочками инструменты, которые вы хотите использовать: гитару, бас, барабаны, фортепиано. Текстовый запрос написать нельзя.

Я выбрала параметры pop music, happy и cooking. Нейросеть сгенерировала шесть треков с немного отличающимся настроением. Можно было создать еще варианты по кнопке Create more music.

После этого я решила отредактировать понравившийся трек. Если кликнуть на него, то откроется редактор. Песня разбита на отрезки с аудиодорожками для основной мелодии басов, барабанов. Это выглядит как эквалайзер из множества синих прямоугольников.

Исправляя громкость отдельных участков, я попыталась подчеркнуть сильные стороны композиции и замаскировать слабые. В этом же режиме редактирования я увеличила продолжительность трека, установила темп и поменяла инструменты. Но результат все равно мне не очень понравился. Музыка получилась однообразной и напомнила саундтрек игры The Sims. Скачать композицию можно только по платной подписке.

Вряд ли результаты генерации Soundraw получится использовать в рекламном ролике. Но зато в редакторе можно почувствовать себя продюсером: поиграться с мелодией и понять, как разные параметры влияют на звучание трека.

Boomy

Качество генерации: 🎵🎵
Что умеет: генерировать инструментальную музыку по заданным параметрам
Лимиты: 25 песен бесплатно, но их нельзя скачать
Платные функции: от 9,99 $⁣ (878 ₽) в месяц за бесконечное количество треков и возможность скачивать мелодии, но российской картой оплатить нельзя

Немного информации о треке, который получился

Сервис сразу предлагает выбрать стиль композиции: электронная музыка, рэп, лоу-фай, грув или медитативная. В этих режимах повлиять на результат генерации невозможно: нейросеть создает случайный трек, подходящий под тематику. Но после генерации можно изменить инструменты и эффекты.

Доступен также пользовательский режим, где все параметры настраиваются вручную заранее. Можно выбрать стиль, темп, инструменты, звучание барабанов, а также саунд-эффекты — например, пение птиц, звуки морского прибоя или дождя.

Хотя нейросеть не умеет генерировать вокал, она предлагает записать собственное пение и наложить поверх созданной мелодии. Слова песни можно сгенерировать по текстовому запросу, но они будут на английском языке.

Я создала трек с ретромотивами, утренним настроением и пением птиц. Сохранить его в бесплатной версии нельзя. Использовать его в рекламе йогурта — тоже вряд ли. Мелодия звучит однообразно и минималистично, а птички на фоне переходят на ультразвук, из-за чего песня становится неприятной.

Loudly

Качество генерации: 🎵🎵🎵🎵
Что умеет: накладывать эффекты, смешивать треки или создавать треки с нуля по заданным параметрам, редактировать их и генерировать музыку по текстовому запросу
Лимиты: бесплатно 25 треков до 30 секунд в месяц, но нельзя скачать
Платные функции: от 10 $⁣ (878 ₽) за 300 песен длительностью до 3,5 минуты в месяц, но российской картой оплатить нельзя

Редактирование трека в Loudly

В Loudly можно тонко настроить будущий трек — указать жанр, ноты, темп, структуру, инструменты. Среди жанров преобладают техно, драм-н-бейс и трэп. Поэтому создать легкие инди-мелодии здесь не получится, а вот диджей-сет для техно-вечеринки — вполне.

Доступна также генерация по текстовому запросу. В этом режиме остальные параметры указывать нельзя. По промпту «a song about yogurt for advertising, dynamic, funny, rhythmic» нейросеть сгенерировала три композиции. Однако ни одна из них не имела почти ничего общего с запросом. Все треки были ритмичными, но не веселыми, которые можно было бы услышать в реальной рекламе.

Я попробовала отредактировать трек по кнопке Studio. Откроется меню, напоминающее диджейский пульт с тумблерами для изменения настроения — по умолчанию они все на нуле. В этой же вкладке я увеличила продолжительность трека. Однако сделать трек инструментами сервиса веселее не вышло. Без подписки сохранить его нельзя.

Нейросеть сгодится для генерации танцевальной музыки, поскольку с другими жанрами справляется хуже. Подойдет новичкам — настроек мало, они очевидные и сразу влияют на результат.

Мы постим кружочки, красивые карточки и новости о технологиях и поп-культуре в нашем телеграм-канале. Подписывайтесь, там классно: @t_technocult

Источник: journal.tinkoff.ru