За последние два года вслед за фотографиями нейросети научились создавать качественную музыку: писать ее на основе стихов (в том числе на русском языке), «придумывать» самостоятельно или генерировать на базе сэмплов. Разбираемся, где и как сделать песню с ИИ, имея только доступ в интернет.
Принципы генерации музыки от нейросетей
Музыкальные нейросети работают по тому же принципу, что и любые другие, например разработанные для генерации текста. Задача любого такого сервиса — выдать результат на основе введенных данных и тренировочного датасета. Для этого требуется обучение. Нейросеть для песен обучают так:
- Показывают входные данные. В случае музыкальных нейросетей это текст. Алгоритмам «скармливают» сотни тысяч формулировок, слов, характеристик и описаний песен.
- Показывают то, что должно получиться из входных данных. В нашем случае это музыка. Каждым входным данным соответствует заранее заготовленный отрезок песни для тренировки.
- Основываясь на парах входных и выходных данных, нейросеть начинает «понимать», что от нее требуется: перевести фразу «мягкая мелодия» в тихую и медленную композицию, а не в тяжелый рок и так далее. Ведь в представлении компьютера музыка — это нули и единицы. Нейросеть просто «разглядывает» паттерны между нулями и единицами входных и выходных данных и пытается их повторить.
- Качество процесса обучения («понимания» паттерна) зависит от того, какой алгоритм тренировки выбрали разработчики.
Такой вид подготовки называется методом обучения с учителем. Качество работы нейросети зависит от количества тренировочных пар входных и выходных данных, а также от того, насколько подходящий алгоритм выбрали разработчики. Это можно сравнить с обучением человека игре на гитаре: преподаватель следит за учеником и делает так, чтоб он (нейросеть) мог играть (распознал паттерн и научился им пользоваться) в соответствии с табулатурой (эталонным результатом).
Примечание: вводить запросы (промпты) в нейросеть надо на английском языке. Иначе они будут работать не так, как задумано. Исключение — нейросеть Suno.
А если живая музыка вам приятнее, чем сгенерированная, присмотритесь к музыкальным инструментам. Например, к гитаре Davinci DC. Для игры на ней не нужен интернет или платная подписка.
9 лучших нейросетей для создания песен и музыки
Suno
Suno считается лучшей музыкальной нейросетью за то, что умеет генерировать песни практически студийного качества на русском языке, озвучивает стихи и предлагает гибкие настройки генерации. В поле ввода просто введите текст будущей песни или опишите музыку, которую хотите услышать. Например, «песня о человеке, который хочет съесть мороженое, но боится растолстеть». Там же можно уточнить запрос, описав жанр: «хард-рок, рэп» и другое.
Если нажать переключатель Custom в верхнем левом углу, то генерацию можно настроить еще тоньше: появится отдельное окно для слов (Lyrics) и еще одно — для описания жанра (Style of Music). Переключатель Instrumental делает так, чтобы музыка генерировалась без слов. Если вы только зарегистрировались, то вам доступны пробные генерации в версии Suno V4. Эта версия делает наиболее реалистичные песни с натуральными интонациями и голосами.
По умолчанию включена версия 3.5. В ней качество хуже, но спутать с живой музыкой тоже можно. Переключатель версии находится в шапке сайта над полем ввода. Получившуюся песню можно скачать или поделиться ей с помощью ссылки. Бесплатно доступно 10 песен, но кредиты на генерацию постепенно увеличиваются. За $10 (примерно 1028 ₽) в месяц лимит вырастет до 500 штук, и пользователь получит лицензию на коммерческое использование музыки. Самый дорогой план стоит $30 (3087 ₽) в месяц и расширяет ограничение до 2000 композиций.
Лайфхак: нейросети можно использовать начинающим певцам и певицам для написания музыки на собственные или просто любимые стихи. Например, так Suno сделала песню из гулявшего по сети пародийного стиха (если бы про Мойдодыра писал Лавкрафт). В Suno нет инструмента создания минуса из песни, но это можно сделать вручную, а затем — спеть самостоятельно. Записать голос поможет даже любительский микрофон. Например, Hiper Broadcast.
Boomy AI
Эта нейросеть для создания музыки генерирует мелодию без вокала по заданным параметрам. Например, можно выбрать грув, мелодию для медитации, лоу-фай или танцевальную электронную музыку. В меню Custom мелодию можно создать с нуля без предварительных настроек стиля: предлагается вручную выбрать жанр, инструменты, партию ударных, эффекты, темп и другое.
В итоге получится композиция длиной до двух минут, напоминающая бит. Скачать ее на ПК можно только после оплаты. Всего доступно два типа подписки: Creator за $9,99 (1027 ₽) и Pro за $29,99 (3086 ₽). Первый позволяет сохранить до 500 треков, скачать в месяц до 10 мелодий и сделать до 15 релизов. У второго лимиты больше, есть лицензия на коммерческое использование и еще несколько преимуществ.
Loudly
Сервис находится на стадии бета-тестирования, но работает стабильно. В рабочей области слева размещен столбик с ячейками, каждая из которых отвечает за один из параметров будущей музыки. Это жанр, продолжительность, второй жанр, энергичность, темп и структура. Под последней понимают динамику музыки. На выбор доступно несколько вариантов. Например, это Classic, когда трек течет стабильно и без резких переходов, или Slow Burn, когда музыка плавно набирает динамику к середине и замедляется к окончанию.
В итоге получается трек длиной 29 секунд. Это отрезок, а для получения полной композиции нужно оплатить подписку. Результат можно скачать бесплатно в формате MP3. А если нажать кнопку Studio, то откроется микшер, где можно подкорректировать результат. Например, изменить жанр.
Бесплатно доступно 15 генераций в день и одно скачивание. За $8 (823 ₽) лимит загрузок расширяется до 300 в месяц, лимит генераций — до 900. Самый дорогой тариф стоит $24 (2469 ₽) в месяц и расширяет лимиты до 3000 генераций и 500 загрузок.
Aiva
Это нейросеть для генерации песен без вокала на основе нескольких источников. Например, из аккордовой прогрессии. Также сайт предлагает прослушать примеры и сделать на основе выбранного варианта свой трек. Еще можно сгенерировать композицию, исходя из стиля музыки, загруженного MIDI-файла или вручную шаг за шагом. Особенность сервиса — он создает академическую музыку или классические произведения, максимально похожие на настоящие.
Если компоновать трек вручную, то сайт поэтапно предложит добавить несколько вводных данных. Все начинается с выбора сэмпла, олицетворяющего какой-либо жанр. Например, Old School Rap.
После этого откроется панель редактирования аккордовой прогрессии, где можно изменить ее вручную или сгенерировать новую по описанию. Затем сайт предложит сделать несколько слоев прогрессии, выбрать продолжительность трека до трех минут и начать генерацию. В месяц можно скачать до трех композиций. Если купить подписку за €11 (1165 ₽) в месяц, лимит увеличится до 15 загрузок, а если за €33 (3495 ₽) — до 300. Также появится лицензия на коммерческое использование сервиса.
Udio
Сервис находится на стадии бета-тестирования. Возможно, поэтому создание песни занимает несколько минут или просто не завершается. Работа с Udio напоминает генерацию песен в Suno. Для начала опишите будущую песню в поле ввода. Русский язык поддерживается, но нейросеть иногда выдумывает слова, поэтому лучше использовать только английский. Если выбрать Auto-generated, то текст добавится автоматически. Для создания инструментальной композиции отметьте галочку Instrumental.
После нажатия кнопки Create нейросеть «напишет» песню длиной 30 секунд. После этого ей можно будет поделиться или скачать в контекстном меню композиции. Еще там можно сгенерировать видео к треку по кнопке Generate Video, дописать трек через кнопку Extend или отредактировать его, нажав Edit. Подписочный план включает в себя два варианта: Standart и Pro. В первом ежемесячно дается 1200 кредитов, во втором — 4800. На одну песню длительностью 30 секунд уходит около двух кредитов.
Лайфхак: сгенерированные композиции можно использовать в караоке, если вы достаточно творческий человек, чтобы сочинить слова к созданной песне. В таком случае присмотритесь к караоке-системе Singing Machine или модели подороже.
Beat Oven
Нейросеть создает мелодии без слов в различных жанрах. Настроек почти нет: можно ввести только промпт, обозначив в нем жанр, набор возможных звуков, тематику, стиль и другие подробности. Например, можно написать: «Фоновая мелодия, которая идеально подойдет для записи уроков вязания крючком». Также можно сконцентрироваться только на самом треке: «Атмосферная музыка с гитарой, ударными и саксофоном, создающая задумчивое настроение».
На выходе получаются четыре сэмпла длиной по минуте. Каждый можно прослушать, настроить и скачать. Две последние возможности доступны по подписке. Настройка подразумевает отключение отдельных элементов трека, например можно убрать басы или ударные прямо на панели воспроизведения.
Если нажать изображение карандаша, то откроется более гибкая панель настройки: в ней можно редактировать трек через текстовые запросы. К примеру: «Сделай гитару потише». Подписка оценивается в минутах загруженных треков. Можно выбрать 15, 30 и 60 минут по цене $30, $100 и $200 (3087 ₽, 10 290 ₽, 20 580 ₽) в год соответственно. Еще можно купить минуты по одной за $3 (308 ₽). Еще одно преимущество подписки — лицензия на загруженную музыку.
Soundful
Нейросеть напоминает Beat Oven — умеет генерировать ненапрягающую фоновую музыку без слов, которая подойдет для записи видео или для прослушивания во время работы или учебы. Особенность Soundful — возможность генерации лупов, то есть закольцованных треков, которые можно вставить в другую композицию или слушать бесконечно.
Другая интересная черта — мелодия создается пошагово, как в конструкторе. Для начала работы выберите предпочитаемый результат: луп, трек или композицию по примеру уже созданной. Затем отметьте жанр, стиль, выберите темп, гамму и нажмите Create Preview.
После создания мелодию можно скачать, но без подписки загрузить получится только одну композицию в месяц. За $4,99 (512 ₽) число загрузок вырастает до 100 и открывается доступ к внутренним покупкам и премиум-контенту. Например, стилям музыки, по образцу которых будет генерироваться ваш трек. Самая дорогая подписка стоит $9,99 (1025 ₽) и позволяет скачивать до 400 треков и до 20 стемов — треков, разделенных на отдельные элементы, такие как ударные, бас и другое.
Обменяй свой старый смартфон на скидку на любой товар в трейд-ин в «Эльдорадо»
Узнать большеImage to Music
В отличие от других нейросетей, эта создает мелодии не из промпта, а из картинки. Вторая особенность — модель, лежащая в основе нейросети, полностью бесплатна. Ее можно скачать и развернуть на ПК при наличии должных знаний и видеокарты NVIDIA. Например, ASUS DUAL RTX 4060 Ti.
Опробовать Image to Music можно на сайте Hugging Face — это хранилище ИИ-моделей с открытым исходным кодом. Вставьте картинку или выберите ее из предложенных и убедитесь, что в поле API status написано: api ready. Если нет, то нажмите на выпадающий список в поле Choose a model и найдите ту, после выбора которой появится надпись: api ready. Далее нажмите кнопку Make music from my pic!.
Модель сгенерирует мелодию, а в поле ввода справа от картинки ее можно будет подкорректировать с помощью текстового запроса. Например, можно написать: «Вдохновляющая мелодия, витающая в воображении счастливого человека». Чтобы скачать трек, нажмите кнопку со стрелкой под надписью Retry with edited prompt.
Stable Audio
Нейросеть для музыки от разработчиков генератора картинок Stable Diffusion. Она тоже доступна для скачивания на компьютер, но можно попробовать и онлайн на сайте разработчиков. Окно для промпта расположено слева, а ниже выбирайте дополнительные параметры — нужно указать длительность композиции или добавить сэмпл. По клику на кнопку Generate нейросеть создаст мелодию длительностью 3 минуты. Вокал генерируется плохо, но инструментальные композиции получаются хорошо.
Если пользоваться онлайн и не разворачивать Stable Audio на ПК, то в бесплатной версии можно создавать до 10 треков в месяц длительностью по три минуты. План Pro стоит $11,99 (1231 ₽) в месяц, повышает количество генераций до 250 и позволяет использовать нейросеть в коммерческих целях. План Studio за $29,99 (3079 ₽) позволяет создавать до 675 треков, а в тарифе Max за $89,99 (9242 ₽) это число возрастает до 2250.
Заключение
- Если вы ищете нейросеть для озвучки стихов, переписки или просто для развлечения, то лучший выбор — Suno.
- Для создания выверенной классической музыки подойдет Aiva.
- Лучшими битмейкерами можно считать Boomy AI и Loudly.
- Если хочется сделать музыку для видео, работы или учебы, то присмотритесь к Beat Oven и Soundful.
- Создать композицию из картинки поможет Image to Music.
- Для трехминутного инструментального трека вам нужна Stable Audio.
- Последние две нейросети можно развернуть на ПК, и их можно будет использовать бесплатно и без ограничений. Но для этого нужен мощный ПК.
2SDnjdd8BHe