Нейросети стремительно вошли в мир креативных индустрий, освоив даже сложные задачи, такие как создание видео и написание музыки. Сегодня на рынке представлены нейросети для создания музыки, которые подходят под любой бюджет и требования. Теперь записать целый альбом за неделю — это не безумие, а вопрос выбора правильной модели ИИ и грамотного промпта. Рассмотрим, как работают такие нейросети.
Как нейросети создают музыку
Даже самый продвинутый ИИ не может создавать музыку из ничего, в отличие от человека. Поэтому перед использованием ИИ его необходимо обучить и протестировать.
Принцип работы ИИ-генераторов музыки
Первый этап подготовки не отличается от обучения нейросетей для написания текстов или создания иллюстраций. Это загрузка обучающей информации — основа всех знаний ИИ. Это тексты и музыка. Анализируя пары текст-музыка, ИИ выделяет и запоминает паттерны создания песен — так же, как человек учится игре на музыкальном инструменте.
Существует два основных подхода к генерации музыки: создание нот, аккордов и текстов или запись готового аудиофайла. Некоторые нейросети могут добавить вокал, учитывая ритм мелодии или текста, структуру песни и её интонацию.
Сегодня выделяют три основных типа генеративных моделей, способных создавать мелодии и тексты песен:
- Рекуррентные нейронные сети (RNN). Они обрабатывают последовательные данные, такие как тексты. RNN могут «запоминать» информацию из предыдущих циклов обработки, что позволяет им успешно писать мелодии и ритмические паттерны, но они не справляются с длинными зависимостями.
- Трансформеры. Следующий этап развития RNN. Они также работают с последовательностями, но не нуждаются в их обработке по порядку. Это ускоряет обучение и работу с данными. Самый известный пример — ChatGPT.
- Генеративно-состязательные сети (GAN). Эта модель представляет собой две соревнующиеся нейросети — генератор и дискриминатор. Одна генерирует данные, другая оценивает их правдоподобность. Чаще этот вариант используется для генерации визуальных материалов, но GAN может быть полезен и при работе со звуковыми фрагментами.
Конечный результат во многом зависит не только от сервиса генерации, но и от используемых промптов. Для некоторых сервисов предпочтителен английский язык, так как запросы на русском они могут не понимать.
С какими жанрами и стилями можно работать
Ограничений в жанрах практически нет. Способности моделей ограничиваются лишь редкостью выбранного направления и массивом данных, на которых они обучены. Если вы хотите поэкспериментировать с редкими жанрами, возможно, придется потратить время на создание более детального промпта или поиск примеров.
Как написать текст для песни с помощью ИИ
Часто создание песни начинается с фразы или идеи для трека. Процесс написания текстов может стать проще и приятнее, если использовать ИИ и подходящие промпты. Разберёмся, как можно написать трек и подобрать идеи аранжировки в одной нейросети.
Доступ к возможностям популярных нейросетей можно получить через WebGPT. Сервис предоставляет широкий набор опций по генерации текста и может помочь в создании композиции. В бесплатной версии доступно семь запросов в день с моделями GPT-4o Mini и Claude 3 Haiku. Также можно использовать шаблоны промптов.
Существует удобная сетка тарифов, которые можно оплатить и продлевать с российской карты: «Мини», «Опти», «Плюс» и «Про». Первый позволяет генерировать в GPT-4o Mini до 189 страниц текста — это 120 тысяч слов в месяц. С помощью ИИ можно создавать изображения: например, для обложки сингла или альбома подойдут Midjourney и DALL·E 3.
Остальные тарифы различаются доступным количеством слов: от 300 тысяч в месяц в «Опти» до 1,2 миллиона слов для «Про». Стоимость подписок начинается от 290 рублей в месяц.
Попробуем сгенерировать песню и придумать для неё подходящую структуру композиции вместе с WebGPT. После регистрации заходим в меню нового чата.

Мы можем написать промпт самостоятельно или поискать подходящий шаблон в библиотеке сервиса. Есть шаблон для рэп-исполнителей, попробуем его.

Выбираем промпт, задаём тему и смотрим, как создаётся текст.

Основа неплохая, но требует небольших корректировок: например, ИИ использовал несуществующие слова. Попробуем придумать сразу варианты мелодий и аранжировки для будущей песни.

Ещё нейросеть может подготовить запрос для создания музыки.

Теперь мы можем использовать полученный текст и идеи композиции для дальнейшей работы над треком. Например, использовать ИИ, чтобы написать мелодию и свести полноценную песню.
6 нейросетей для генерации музыки
Все ИИ-сервисы для работы с музыкой делятся на две категории: треки без текста и полноценные песни с текстом. Их применение ограничено только фантазией и запросом пользователя и возможностями выбранного тарифа. Разберём несколько интересных вариантов.
Для готовых треков без текста: Soundraw, AIVA, Boomy, Soundful
Если хотите создать уникальный саундтрек, фоновую мелодию или бит без слов, эти нейросети помогут сгенерировать готовые треки в разных жанрах.
Soundraw

Что умеет: позволяет сгенерировать музыку более чем в 30 жанрах. Настройки позволяют выбрать одно из 20+ настроений, указать тему (например, влог или корпоратив) и длительность трека. Также есть настройки темпа и используемых музыкальных инструментов.
Платные подписчики могут загружать от 10 до неограниченного количества треков и скачивать их в форматах mp3, WAV и stems. Также можно использовать мелодии в коммерческих целях.
Сколько стоит: Soundraw предлагает обширную тарифную сетку для отдельных авторов и компаний. Для создателей контента предусмотрены тарифы от 16,99 до 49,99 долларов в месяц. Стоимость для больших компаний уточняется отдельно.
AIVA

Что умеет: создаёт треки по нескольким сценариям: по стилю, аккордовой последовательности, из загружаемого файла или шаг за шагом. Пользователи могут слушать радио по стилям или пройти обучение по созданию треков.
Для бесплатных аккаунтов доступно до трёх загрузок в месяц, длительность трека до 3 минут. Авторские права остаются у сервиса, монетизация запрещена.
Для аккаунтов со стандартным тарифом доступно до 15 загрузок в месяц. Авторские права остаются у AIVA, но сервис не нужно указывать в списке создателей, есть ограниченная монетизация.
Для профессиональных аккаунтов доступно до 300 загрузок в месяц. Все авторские права принадлежат владельцу аккаунта, сервис не указывается в списке создателей, полная монетизация разрешена.
Сколько стоит: стандартная подписка — 11 евро в месяц, профессиональная — 33 евро. НДС оплачивается отдельно.
Boomy

Что умеет: позволяет создавать мелодии в выбранных жанрах или пользовательском режиме. В нём можно выбрать стиль, музыкальные инструменты, звуковые эффекты и другие параметры.
В базовом тарифе можно создавать и редактировать треки, но доступно только базовое редактирование. Можно сохранить до 25 песен, но загрузка произведений недоступна.
В тарифе Creator расширены возможности редактирования, можно сохранять до 500 песен. Загрузка до 25 треков в формате WAV в месяц.
Для подписчиков PRO доступен весь функционал редактирования песен. Количество сохранённых песен не ограничено, загрузка до 250 треков в формате WAV.
В тарифах Creator и PRO пользователи получают полные коммерческие права.
Сколько стоит: тариф Creator — 14,99 долларов в месяц, тариф PRO — 39,99 долларов в месяц.
Soundful

При регистрации пользователю предложат выбрать одну из ролей: продюсер, певец, рэпер, DJ, инфлюенсер, создатель контента для соцсетей или видео, бизнесмен. Можно указать предпочитаемые жанры.

Что умеет: этот сервис силён в создании приятной фоновой музыки без слов. Создание треков производится по жанрам, можно выбрать скорость музыки, громкость и исполнение. В бесплатной версии нет ограничений по генерации треков. Доступно более 25 жанров и возможность загрузки одного файла в формате MP3 в месяц.
В Premium появляется лицензия создателя музыки и премиум-контент, доступ к 150 жанрам и загрузка 100 файлов в формате MP3 и WAV в месяц. В тарифе PRO — до 400 загрузок, загрузка stem-файлов.
Сколько стоит: тариф Premium — 5 долларов в месяц, тариф PRO — 9,99 долларов в месяц при оплате за год, 14,99 долларов при помесячной оплате.
Для создания песен с текстом: Suno, Udio
Хотите создать настоящий хит, но нет вдохновения? Современные ИИ-сервисы могут не только придумать мелодию, но и написать текст за вас.
Suno

Что умеет: это полноценная нейросеть для песен, она способна создавать и музыку, и тексты. Можно выбрать предпочитаемые жанры из списка тегов или исключить неподходящие, применить авторежим для создания текста или добавить уже готовый материал.
Важно учитывать, что Suno может сгенерировать текст песен на том же языке, на котором написан промпт. Поэтому лучше писать запросы или на требуемом языке, или на английском.
В бесплатном тарифе доступна версия нейросети версии 3.5, каждый день добавляется 50 кредитов для оплаты генерации песен — это около 10 песен в сутки. Также можно загружать аудио длиной до 1 минуты. Очередь на создание треков общая, при этом нет возможности покупки дополнительных кредитов, а также запрещено коммерческое использование.
Для пользователей с тарифом PRO доступна последняя версия Suno — 4.5 с ранним доступом к новым функциям. Каждый месяц начисляются 2500 кредитов, которых хватит на создание примерно 500 песен. Расширенные функции и деление треков до 12 дорожек (вокал и инструменты). Загрузка аудио продолжительностью до 8 минут. Коммерческие права на созданные песни переходят к пользователям. Также есть приоритетная очередь создания и возможность покупать кредиты.
В тарифе Premier добавляется количество кредитов — до 10 тысяч в месяц. В остальном тариф копирует функции PRO.
Сколько стоит: тариф Pro — 8 долларов в месяц при оплате за год, тариф Premier — 24 доллара. При помесячной оплате стоимость подписок составит 10 и 30 долларов соответственно.
Udio

Что умеет: создаёт композиции под требования пользователя. Можно выбрать подходящие жанры, загрузить аудиофайл-референс, указать требования к тексту песни. Во вкладке с продвинутыми настройками (стоимость два кредита) удобно настраивать генерацию клипов, время включения текста, учёт требований промпта при создании трека и скорость обработки.
Пользователи без подписки могут генерировать до четырёх песен одновременно, но не более трёх песен продолжительностью 2 минуты 10 секунд в день. Количество кредитов в день — 10, дополнительный кредитный лимит в месяц — 100.
Пользователи тарифа Standart могут генерировать до шести песен одновременно. Есть опция редактирования треков, создания песни из аудиоклипов, загрузки аудиофайлов, работы с обложками. Кредитный лимит составляет 1 200 на месяц без ограничений в течение дня (но не в пробной версии).
Тариф PRO отличается количеством одновременно генерируемых песен — здесь их максимум восемь — и количеством кредитов на месяц — 4 800. Также песня может быть создана из стилистических референсов.
Сколько стоит: тариф Standart — 8 долларов в месяц при оплате за год или 10 долларов при помесячной подписке. Тариф PRO — 24 доллара в месяц при оплате за весь год или 30 долларов, если рассчитываться за каждый месяц отдельно.
Как создать песню с помощью нейросети: пошаговая инструкция
Шаг 1. Выберите сервис и зарегистрируйтесь
Попробуем создать трек без слов. Помощь в этом нам окажет нейросеть AIVA — она открывается без применения дополнительных расширений или манипуляций с сетью. А пока мы будем создавать музыку, можем послушать радио. Переходим на сайт и выбираем подходящий формат регистрации.

Шаг 2. Настройте параметры: жанр, темп, инструменты
Для выбора способа генерации нажимаем кнопку Create и выбираем нужный. Используем генерацию по шагам.

Выбираем подходящий жанр. Остановимся на фолк-роке.

Проверим настройки композиции или пропишем дополнительные требования. Нажимаем Generate.

Шаг 3. Сгенерируйте и отредактируйте результаты
Полученный результат можно посмотреть и изменить. Любую дорожку получится вывести в соло-исполнение или заглушить.

Также дорожки можно точечно изменять по нажатию на значок карандаша.

Выбираем продолжительность композиции, указываем количество треков, даём название рабочему пространству и сохраняем его в своей учётной записи.

Нажимаем Create Composition и ждём.

Теперь получившийся трек можно послушать, загрузить, отредактировать или удалить.

При генерации и редактировании треков стоит помнить о лимитах для бесплатного тарифа. Об этом сообщает индикатор в нижнем левом углу.
Плюсы и минусы ИИ-музыки
При всех своих преимуществах на данном этапе развития ИИ для создания музыки остаются мощными, но лишь инструментами. Как у любого инструмента, у них тоже есть свои сильные и слабые стороны. Без общей законодательной базы остаются и некоторые острые вопросы, такие как авторские права и интеллектуальная собственность.
Преимущества
Искусственный интеллект меняет подход к созданию музыки — он не заменяет творчество, а расширяет возможности. Вот ключевые плюсы работы с нейросетями:
- Ускорение процессов. На создание музыки и текстов уходит меньше времени, чем при «ручной» работе. Свести детали в полноценный трек можно без студий, профессиональной аппаратуры и техники.
- Гибкость в работе. Многие сервисы позволяют экспериментировать с одним мотивом столько времени, сколько нужно, чтобы добиться наилучшего результата.
- Создание уникальных композиций. При правильном использовании промптов и комбинации жанров можно получить оригинальную мелодию или готовую песню.
- Доступность без музыкального образования. Алгоритм может предложить неожиданные, но подходящие решения, даже если вы не знаете теорию музыки. Нейросети помогают находить новые идеи, мотивы и стили в процессе работы над треком.
Недостатки
Нейросети открыли новые горизонты для творчества, но их использование связано с объективными сложностями:
- Самоповторы. Основной недостаток ИИ — его же сильная сторона: работа с паттернами и обучение на уже имеющихся материалах. Это неизбежно влечёт за собой шаблонность и узость подхода. Но этот минус можно обойти при помощи подробного промпта и чётких требований по желаемому результату.
- Сложности с авторскими правами. Многие произведения, на которых обучаются модели, имеют авторов. Но их композиции используются бесплатно, что несёт не только творческий, но и материальный ущерб. Уже появились законы, регламентирующие работу ИИ в области интеллектуальной собственности, но до формирования единой и взвешенной системы ещё далеко.
Нейросети не смогут полноценно заменить талантливых музыкантов и певцов, но с их помощью каждый может попробовать себя в роли композитора. Не бойтесь тестировать разные сервисы — как минимум один сможет открыть вам дорогу к собственной музыке и вдохновению.
Обложка: freepik / Freepik

