8 мин. на чтение

От Suno до Loudly: топ-9 нейросетей для создания музыки

img

За последние два года вслед за фотографиями нейросети научились создавать качественную музыку: писать ее на основе стихов (в том числе на русском языке), «придумывать» самостоятельно или генерировать на базе сэмплов. Разбираемся, где и как сделать песню с ИИ, имея только доступ в интернет.

Принципы генерации музыки от нейросетей

Музыкальные нейросети работают по тому же принципу, что и любые другие, например разработанные для генерации текста. Задача любого такого сервиса — выдать результат на основе введенных данных и тренировочного датасета. Для этого требуется обучение. Нейросеть для песен обучают так:

  1. Показывают входные данные. В случае музыкальных нейросетей это текст. Алгоритмам «скармливают» сотни тысяч формулировок, слов, характеристик и описаний песен.
  2. Показывают то, что должно получиться из входных данных. В нашем случае это музыка. Каждым входным данным соответствует заранее заготовленный отрезок песни для тренировки.
  3. Основываясь на парах входных и выходных данных, нейросеть начинает «понимать», что от нее требуется: перевести фразу «мягкая мелодия» в тихую и медленную композицию, а не в тяжелый рок и так далее. Ведь в представлении компьютера музыка — это нули и единицы. Нейросеть просто «разглядывает» паттерны между нулями и единицами входных и выходных данных и пытается их повторить.
  4. Качество процесса обучения («понимания» паттерна) зависит от того, какой алгоритм тренировки выбрали разработчики.

Такой вид подготовки называется методом обучения с учителем. Качество работы нейросети зависит от количества тренировочных пар входных и выходных данных, а также от того, насколько подходящий алгоритм выбрали разработчики. Это можно сравнить с обучением человека игре на гитаре: преподаватель следит за учеником и делает так, чтоб он (нейросеть) мог играть (распознал паттерн и научился им пользоваться) в соответствии с табулатурой (эталонным результатом).

Примечание: вводить запросы (промпты) в нейросеть надо на английском языке. Иначе они будут работать не так, как задумано. Исключение — нейросеть Suno.

А если живая музыка вам приятнее, чем сгенерированная, присмотритесь к музыкальным инструментам. Например, к гитаре Davinci DC. Для игры на ней не нужен интернет или платная подписка.

Классическая гитара Davinci DC-50A BK
4 170 р.*
Смотреть товар

9 лучших нейросетей для создания песен и музыки

Лучший генератор песен

Suno

Ссылка на сервис

img

Suno считается лучшей музыкальной нейросетью за то, что умеет генерировать песни практически студийного качества на русском языке, озвучивает стихи и предлагает гибкие настройки генерации. В поле ввода просто введите текст будущей песни или опишите музыку, которую хотите услышать. Например, «песня о человеке, который хочет съесть мороженое, но боится растолстеть». Там же можно уточнить запрос, описав жанр: «хард-рок, рэп» и другое.

img
Слева видно окно для промптов и жанра музыки. Выбрать версию Suno и загрузить сэмпл можно по кнопкам над полем ввода

Если нажать переключатель Custom в верхнем левом углу, то генерацию можно настроить еще тоньше: появится отдельное окно для слов (Lyrics) и еще одно — для описания жанра (Style of Music). Переключатель Instrumental делает так, чтобы музыка генерировалась без слов. Если вы только зарегистрировались, то вам доступны пробные генерации в версии Suno V4. Эта версия делает наиболее реалистичные песни с натуральными интонациями и голосами.

img
В результате всегда получаются две песни с одинаковыми словами, но разным аккомпанементом

По умолчанию включена версия 3.5. В ней качество хуже, но спутать с живой музыкой тоже можно. Переключатель версии находится в шапке сайта над полем ввода. Получившуюся песню можно скачать или поделиться ей с помощью ссылки. Бесплатно доступно 10 песен, но кредиты на генерацию постепенно увеличиваются. За $10 (примерно 1028 ₽) в месяц лимит вырастет до 500 штук, и пользователь получит лицензию на коммерческое использование музыки. Самый дорогой план стоит $30 (3087 ₽) в месяц и расширяет ограничение до 2000 композиций.

img
Тарифы

Лайфхак: нейросети можно использовать начинающим певцам и певицам для написания музыки на собственные или просто любимые стихи. Например, так Suno сделала песню из гулявшего по сети пародийного стиха (если бы про Мойдодыра писал Лавкрафт). В Suno нет инструмента создания минуса из песни, но это можно сделать вручную, а затем — спеть самостоятельно. Записать голос поможет даже любительский микрофон. Например, Hiper Broadcast.

Микрофон Hiper Broadcast USB Set
4 799 р.*
Смотреть товар
ИИ-битмейкер

Boomy AI

Ссылка на сервис

img

Эта нейросеть для создания музыки генерирует мелодию без вокала по заданным параметрам. Например, можно выбрать грув, мелодию для медитации, лоу-фай или танцевальную электронную музыку. В меню Custom мелодию можно создать с нуля без предварительных настроек стиля: предлагается вручную выбрать жанр, инструменты, партию ударных, эффекты, темп и другое.

img
Меню создания трека по умолчанию
img
Создание вручную

В итоге получится композиция длиной до двух минут, напоминающая бит. Скачать ее на ПК можно только после оплаты. Всего доступно два типа подписки: Creator за $9,99 (1027 ₽) и Pro за $29,99 (3086 ₽). Первый позволяет сохранить до 500 треков, скачать в месяц до 10 мелодий и сделать до 15 релизов. У второго лимиты больше, есть лицензия на коммерческое использование и еще несколько преимуществ.

img
(Библиотека созданных композиций)
img
Подписочные планы

Ранее мы рассказывали:

Как создать свой медиасервер
Тоже битмейкер, но с возможностью бесплатного скачивания

Loudly

Ссылка на сервис

img

Сервис находится на стадии бета-тестирования, но работает стабильно. В рабочей области слева размещен столбик с ячейками, каждая из которых отвечает за один из параметров будущей музыки. Это жанр, продолжительность, второй жанр, энергичность, темп и структура. Под последней понимают динамику музыки. На выбор доступно несколько вариантов. Например, это Classic, когда трек течет стабильно и без резких переходов, или Slow Burn, когда музыка плавно набирает динамику к середине и замедляется к окончанию.

img
Начальный экран
img
Выбор жанра

В итоге получается трек длиной 29 секунд. Это отрезок, а для получения полной композиции нужно оплатить подписку. Результат можно скачать бесплатно в формате MP3. А если нажать кнопку Studio, то откроется микшер, где можно подкорректировать результат. Например, изменить жанр.

img
Сгенерированные треки

Бесплатно доступно 15 генераций в день и одно скачивание. За $8 (823 ₽) лимит загрузок расширяется до 300 в месяц, лимит генераций — до 900. Самый дорогой тариф стоит $24 (2469 ₽) в месяц и расширяет лимиты до 3000 генераций и 500 загрузок.

img
Тарифы
Композиция без вокала по MIDI, сэмплу или аккордовой прогрессии

Aiva

Ссылка на сервис

img

Это нейросеть для генерации песен без вокала на основе нескольких источников. Например, из аккордовой прогрессии. Также сайт предлагает прослушать примеры и сделать на основе выбранного варианта свой трек. Еще можно сгенерировать композицию, исходя из стиля музыки, загруженного MIDI-файла или вручную шаг за шагом. Особенность сервиса — он создает академическую музыку или классические произведения, максимально похожие на настоящие.

img
Стартовый экран
img
Меню создания трека

Если компоновать трек вручную, то сайт поэтапно предложит добавить несколько вводных данных. Все начинается с выбора сэмпла, олицетворяющего какой-либо жанр. Например, Old School Rap.

img
Редактор прогрессии
img
Меню загрузки MIDI-файла

После этого откроется панель редактирования аккордовой прогрессии, где можно изменить ее вручную или сгенерировать новую по описанию. Затем сайт предложит сделать несколько слоев прогрессии, выбрать продолжительность трека до трех минут и начать генерацию. В месяц можно скачать до трех композиций. Если купить подписку за €11 (1165 ₽) в месяц, лимит увеличится до 15 загрузок, а если за €33 (3495 ₽) — до 300. Также появится лицензия на коммерческое использование сервиса.

img
Готовый трек
img
Варианты подписки
Почти как Suno

Udio

Ссылка на сервис

img

Сервис находится на стадии бета-тестирования. Возможно, поэтому создание песни занимает несколько минут или просто не завершается. Работа с Udio напоминает генерацию песен в Suno. Для начала опишите будущую песню в поле ввода. Русский язык поддерживается, но нейросеть иногда выдумывает слова, поэтому лучше использовать только английский. Если выбрать Auto-generated, то текст добавится автоматически. Для создания инструментальной композиции отметьте галочку Instrumental.

img
Генерация песни

После нажатия кнопки Create нейросеть «напишет» песню длиной 30 секунд. После этого ей можно будет поделиться или скачать в контекстном меню композиции. Еще там можно сгенерировать видео к треку по кнопке Generate Video, дописать трек через кнопку Extend или отредактировать его, нажав Edit. Подписочный план включает в себя два варианта: Standart и Pro. В первом ежемесячно дается 1200 кредитов, во втором — 4800. На одну песню длительностью 30 секунд уходит около двух кредитов.

img
Расширенное меню создания композиции
img
Контекстное меню трека
img
Планы подписок

Лайфхак: сгенерированные композиции можно использовать в караоке, если вы достаточно творческий человек, чтобы сочинить слова к созданной песне. В таком случае присмотритесь к караоке-системе Singing Machine или модели подороже.

Музыкальный центр-караоке Singing machine SML385UBK
8 490 р.*
Смотреть товар
Караоке система Ikarao Break X2
54 990 р.*
Смотреть товар
Фоновая музыка для видео

Beat Oven

Ссылка на сервис

img

Нейросеть создает мелодии без слов в различных жанрах. Настроек почти нет: можно ввести только промпт, обозначив в нем жанр, набор возможных звуков, тематику, стиль и другие подробности. Например, можно написать: «Фоновая мелодия, которая идеально подойдет для записи уроков вязания крючком». Также можно сконцентрироваться только на самом треке: «Атмосферная музыка с гитарой, ударными и саксофоном, создающая задумчивое настроение».

img
Основная панель инструментов

На выходе получаются четыре сэмпла длиной по минуте. Каждый можно прослушать, настроить и скачать. Две последние возможности доступны по подписке. Настройка подразумевает отключение отдельных элементов трека, например можно убрать басы или ударные прямо на панели воспроизведения.

img
Результат
img
Результат

Если нажать изображение карандаша, то откроется более гибкая панель настройки: в ней можно редактировать трек через текстовые запросы. К примеру: «Сделай гитару потише». Подписка оценивается в минутах загруженных треков. Можно выбрать 15, 30 и 60 минут по цене $30, $100 и $200 (3087 ₽, 10 290 ₽, 20 580 ₽) в год соответственно. Еще можно купить минуты по одной за $3 (308 ₽). Еще одно преимущество подписки — лицензия на загруженную музыку.

img
Подписочные планы
Мелодии для учебы, работы или фона

Soundful

Ссылка на сервис

img

Нейросеть напоминает Beat Oven — умеет генерировать ненапрягающую фоновую музыку без слов, которая подойдет для записи видео или для прослушивания во время работы или учебы. Особенность Soundful — возможность генерации лупов, то есть закольцованных треков, которые можно вставить в другую композицию или слушать бесконечно.

img
Чтобы начать, нажмите розовую кнопку в правом нижнем углу
img
Выбор категории при создании лупа
img
Выбор стиля

Другая интересная черта — мелодия создается пошагово, как в конструкторе. Для начала работы выберите предпочитаемый результат: луп, трек или композицию по примеру уже созданной. Затем отметьте жанр, стиль, выберите темп, гамму и нажмите Create Preview.

img
Настройка лупа
img
Загрузка результата

После создания мелодию можно скачать, но без подписки загрузить получится только одну композицию в месяц. За $4,99 (512 ₽) число загрузок вырастает до 100 и открывается доступ к внутренним покупкам и премиум-контенту. Например, стилям музыки, по образцу которых будет генерироваться ваш трек. Самая дорогая подписка стоит $9,99 (1025 ₽) и позволяет скачивать до 400 треков и до 20 стемов — треков, разделенных на отдельные элементы, такие как ударные, бас и другое.

img
Подписочные планы

Обменяй свой старый смартфон на скидку на любой товар в трейд-ин в «Эльдорадо»

Узнать больше
Музыка из картинки

Image to Music

Ссылка на сервис

img

В отличие от других нейросетей, эта создает мелодии не из промпта, а из картинки. Вторая особенность — модель, лежащая в основе нейросети, полностью бесплатна. Ее можно скачать и развернуть на ПК при наличии должных знаний и видеокарты NVIDIA. Например, ASUS DUAL RTX 4060 Ti.

Видеокарта Asus DUAL-RTX4060TI-O16G-EVO
64 199 р.*
Смотреть товар

Опробовать Image to Music можно на сайте Hugging Face — это хранилище ИИ-моделей с открытым исходным кодом. Вставьте картинку или выберите ее из предложенных и убедитесь, что в поле API status написано: api ready. Если нет, то нажмите на выпадающий список в поле Choose a model и найдите ту, после выбора которой появится надпись: api ready. Далее нажмите кнопку Make music from my pic!.

img
Созданная мелодия

Модель сгенерирует мелодию, а в поле ввода справа от картинки ее можно будет подкорректировать с помощью текстового запроса. Например, можно написать: «Вдохновляющая мелодия, витающая в воображении счастливого человека». Чтобы скачать трек, нажмите кнопку со стрелкой под надписью Retry with edited prompt.

От создателей Stable Diffusion

Stable Audio

Ссылка на сервис

img

Нейросеть для музыки от разработчиков генератора картинок Stable Diffusion. Она тоже доступна для скачивания на компьютер, но можно попробовать и онлайн на сайте разработчиков. Окно для промпта расположено слева, а ниже выбирайте дополнительные параметры — нужно указать длительность композиции или добавить сэмпл. По клику на кнопку Generate нейросеть создаст мелодию длительностью 3 минуты. Вокал генерируется плохо, но инструментальные композиции получаются хорошо.

img
Начальный экран
img
Созданная мелодия

Если пользоваться онлайн и не разворачивать Stable Audio на ПК, то в бесплатной версии можно создавать до 10 треков в месяц длительностью по три минуты. План Pro стоит $11,99 (1231 ₽) в месяц, повышает количество генераций до 250 и позволяет использовать нейросеть в коммерческих целях. План Studio за $29,99 (3079 ₽) позволяет создавать до 675 треков, а в тарифе Max за $89,99 (9242 ₽) это число возрастает до 2250.

img
Тарифы

Заключение

  • Если вы ищете нейросеть для озвучки стихов, переписки или просто для развлечения, то лучший выбор — Suno.
  • Для создания выверенной классической музыки подойдет Aiva.
  • Лучшими битмейкерами можно считать Boomy AI и Loudly.
  • Если хочется сделать музыку для видео, работы или учебы, то присмотритесь к Beat Oven и Soundful.
  • Создать композицию из картинки поможет Image to Music.
  • Для трехминутного инструментального трека вам нужна Stable Audio.
  • Последние две нейросети можно развернуть на ПК, и их можно будет использовать бесплатно и без ограничений. Но для этого нужен мощный ПК.
Реклама. Рекламодатель: ООО «МВМ»
2SDnjdd8BHe

Посмотреть все товары

Выбрать
*Информация о товарах, размещенная на «Эльдоблоге», не является публичной офертой. Цена товаров приведена справочно. С актуальными ценами на товары в соответствующем регионе вы можете ознакомиться на сайте eldorado.ru
Любите делиться своим мнением о технике? Тогда напишите обзор товара в «Эльдоблоге» — и получите до 1000 бонусов на новые покупки!