Как создать настоящий ИИ-хит, если вы ничего не понимаете в музыке

Раньше, чтобы записать песню, нужны были годы обучения, студия и деньги. Сейчас нейросети вроде Suno и Udio позволяют создавать музыку всем — от офисного сотрудника до инженера Газпрома. В этой колонке разберёмся, как правильно использовать ИИ для генерации треков, загружать их на стриминговые площадки — и нужно ли для этого музыкальное образование.
Что нужно знать об ИИ-музыке
Долгое время сочинение песен считалось уделом избранных: раньше репертуар для звёзд готовили профессиональные композиторы в связке с поэтами-песенниками. В нулевые исполнители сводили треки сами или заказывали их у специальных людей — сонграйтеров. Так или иначе, это делали люди с музыкальным образованием, имеющие представление о нотной грамоте.
Эра искусственного интеллекта существенно сократила пропасть между обычными людьми и профессионалами, сделав создание музыки доступным всем. И сейчас нейросети за короткий срок генерят сразу несколько версий трека. Пользователь может выбрать самый удачный, разместить на стриминговых платформах и получать роялти — отчисления за прослушивания.
Исследование Morgan Stanley , что 50–60% людей в возрасте от 18 до 44 лет тратят на прослушивание нейромузыки примерно три часа в неделю. Отношение стриминговых сервисов к таким композициям разнится. Например, французская платформа Deezer ежедневно до 60 тысяч треков, сгенерированных ИИ. И руководство компании объявило, что «человеческие» композиции имеют приоритет по выплатам роялти от прослушивания. Ну а ИИ-музыка будет демонетизироваться. Это касается как треков, полностью созданных нейросетями, так и доработанных с их участием — такие песни тоже понижаются в выдаче.
А в крупнейшем в мире стриминговом сервисе из Швеции Spotify внутренний протокол регуляции ИИ-песен. Артистов не наказывают за использование нейросетей, но активно помечают такой контент. А также борются с музыкальным мусором и дублями одних и тех же песен.
Российские стриминговые платформы относятся к ИИ-трекам гораздо лояльнее. Например, в «Яндекс Музыке» существует даже отдельный плейлист — «Люди ИИскусства».
При этом ИИ-треки по всему миру возглавляют чарты и собирают миллионы прослушиваний. Это обеспечивает создателям по 200–300 тысяч рублей в квартал — мы видим это по внутренней статистике нашего сервиса, который подтягивает аналитику со всех стриминговых платформ. А создатели особо удачных проектов и вовсе получают многомиллионные предложения о покупке авторских прав и заключают контракты с крупными артистами.
Например, виртуальная исполнительница Sasha Komovich — автор нашумевшей «Снегурочки» — недавно выпустила совместный релиз с Димой Биланом. А это — дополнительный буст популярности и возможность монетизации творчества. Примечательно, что создательница ИИ-артистки — фотограф из Геленджика, которая до этого никогда не занималась музыкой.
Какие нейросети для генерации музыки есть сегодня
Список вариантов довольно широк. Ниже — несколько нейросетей с самыми интересными возможностями.
Suno
Позволяет создавать полноценные треки длиной до нескольких минут с вокалом, инструментами и текстом с помощью одного описания. Работает в жанрах рэпа, рока, хип-хопа, джаза, попа, фонка, инди, классики и так далее. При этом пользователь может попросить как загрузить собственный текст, так и сгенерировать его. Минус: треки, созданные бесплатной версией приложения, не предназначены для коммерческого использования. А платная версия будет стоить до 10 долларов в месяц.
Riffusion
Позволяет генерить 12-секундные музыкальные отрывки для соцсетей. Подойдёт тем, кто ищет нейросеть для создания коротких роликов вертикального формата. Сервис полностью бесплатный — можно делать неограниченное число запросов. Выдаёт до трёх вариантов аудио.
Mubert
Нейросеть позволяет генерить 15–25-минутные фоновые композиции — для этого достаточно указать в промпте настроение и жанр. Особенно хорошо работает с электроникой, техно и эмбиентом. Сервис часто встраивают в приложения для сна и медитации, а если нажать Play, нейросеть будет постоянно генерить новую фоновую музыку из семплов, записанных реальными музыкантами.
Mubert не подойдёт для создания полноценных треков, так как не во всех жанрах есть функция генерации вокала. Но если вы делаете подкасты или снимаете ролики и не хотите столкнуться с проблемой авторских прав, этот вариант станет отличным решением.
Udio
Больше подойдёт профессионалам индустрии, а не новичкам: алгоритмы Udio обучены понимать сложные запросы, основанные на музыкальной теории, — от джазовых гармоний до техникал-дэта. Один из основных конкурентов Suno. Есть функция Inpainting, позволяющая редактировать фрагменты, а не весь трек. Например, с её помощью можно исправить длину припева.
Stable Audio
Ещё один инструмент, предусмотренный скорее для профессионалов, а не для новичков. Позволяет детально рассчитать сценарий композиции. Например, если вам нужно, чтобы вокал начался с 30‑й секунды — Stable Audio 2.0 это умеет. Сервис хорош для видеографов и гейм-дизайнеров, потому что помогает отлично синхронизировать картинку и звук. Кроме того, он позволяет генерировать треки с нестандартным хронометражем — час и более, в то время как другие нейросети чаще всего выдают композиции на 2–3 минуты.
Fadr
Даёт возможность создавать миксы на основе уже существующих треков: загружаете на сервис любимую композицию, просите переделать в другом жанре и наслаждаетесь результатом. Здесь можно делать мэшапы и ремиксы — почувствуйте себя диджеем. Отлично подойдёт для запуска трендов со старыми песнями в TikTok.
Из перечисленных выше приложений чаще всего новую музыку генерят в Suno. Для меня эта нейросеть самая удобная: здесь интуитивно понятный интерфейс, несложный принцип работы и отличные возможности для доработки композиции. Важно: если вы планируете использовать вашу музыку для заработка и хотите создать хит, лучше сразу оформляйте подписку.
Как объяснить нейросети, что вы хотите хит
Представьте, что нейросеть — это актёр. Ей нужно знать не только что исполнять, но и как. И если ваш запрос будет выглядеть как «Поп-песня про любовь», результат будет соответствующий. Чем больше вводных, тем лучше, поэтому вариант «Меланхоличный инди-поп, 76 BPM, тональность G. Вокал: женский альт, придыхательный, интимный, запись крупным планом. Куплет — шёпот, припев — раскрывается с лёгким вибрато» даст гораздо более интересный результат. Но что делать, если вы не знаете, что такое альт, тональность, какой вокал интимный и какую BPM задать, да и вообще — что это такое? Давайте попробуем разобраться с каждым шагом.
Определитесь с настроением
Нет, недостаточно написать «Грустное». Подумайте: это светлая грусть о ком-то, кто не с нами? Или печаль человека, который потерял всех друзей? А может, грусть от расставания? Что вы хотите выразить? Что хотите донести своим треком?
Вы можете вложить в композицию любые чувства — например, ревность. В таком случае песня должна получиться напряжённой — сюда будет интересно добавить пианино в нижнем регистре или какие-то дьявольские скрипки, как у Паганини, чтобы передать ощущение натянутых до предела нервов.
Рекомендуем подключить фантазию и вспомнить побольше эпитетов. К примеру, попробуйте для начала задать такой промпт: «Создай песню. Настроение — светлая грусть от расставания с любимым человеком, переходящая в радостное предвкушение обновления».
Выберите жанр
Что это будет? Рэп? Клубная музыка? Инди? Вспомните ваши любимые жанры и обязательно задайте этот параметр. Иначе ИИ будет принимать решение самостоятельно и результат может получиться непредсказуемым. Если вы слабо разбираетесь в музыкальных направлениях, вбейте в поиске артистов, которые вам нравятся, и посмотрите, в каком жанре они работают.
Итак, пишем: «Создай песню в жанре рэп. Настроение — лёгкая грусть от расставания с любимым человеком, переходящая в радостное предвкушение обновления».
Определитесь с музыкальным ладом
Их два: мажор и минор. Мажор ассоциируется с чем-то светлым и хорошим, минор — с тёмными сторонами в нас. Этого достаточно, для того чтобы придать песне необходимый окрас.
Выберите темп
Речь о том самом загадочном BPM, которое упоминалось ранее. Коротко говоря, это темп музыки. Большинство песен написано в промежутке 30–240 BPM. Например, эмбиент — это 60–90 BPM, мелодичный рок может быть в диапазоне 65–95 BPM. Поп-музыка, как правило, — 100–120 BPM. Дабстеп, транс и техно создаются в промежутке 120–155 BPM. А самые быстрые треки в жанре драм-н-бейс или хардкор-техно достигают 200+ BPM.
Итак, пишем: «Создай песню в жанре рэп. Настроение — лёгкая грусть от расставания с любимым человеком, переходящая в радостное предвкушение обновления. Музыкальный лад — минор, темп — 95 BPM».
Выберите инструменты, которые будут звучать в вашем треке
Пианино, орган, синтезатор, саксофон, скрипка, тромбон… А может, вы хотите, чтобы кто-то отбивал ритм, хлопая в ладоши? Всё это тоже можно и нужно прописывать. Конечно, если вы новичок, то будет сложно сразу указать все инструменты, которые вам хотелось бы услышать. Но попробуйте выбрать хотя бы солирующий инструмент и определить его место в композиции, например: «Гитарное соло в припеве и пианино во вступлении».
Подумайте о вокале
Он женский или мужской? Голос высокий или низкий? Высокий и лёгкий женский голос — это сопрано. Более густой и насыщенный, как у Уитни Хьюстон или Аврил Лавин, — меццо-сопрано. Самый низкий и глубокий — это контральто. Такой голос у Шер — знаменитой американской певицы.
Если это мужской вокал, то тенор — самый лёгкий и высокий, как у Бруно Марса. Баритон — бархатистый, мужественный. Это очень популярный тембр, которым обладают Сергей Лазарев, Дрейк или Трой Сиван. Бас — низкий, мощный, грудной, как у Джонни Кэша. В российской поп-индустрии глубокие басы в вокале практически не представлены среди главных чарт-топеров — они уступают место более высоким тембрам. Детские голоса делятся на сопрано (высокий) и альт (низкий).
Подумайте: вы хотите, чтобы в начале песни была распевка? Голос должен быть с хрипотцой или без? При этом учтите: вы не можете писать, что нейросеть должна сгенерировать трек, в котором будет звучать голос Адель.
В российском законодательстве голос сам по себе не является объектом авторского права, которое защищает результаты творческой деятельности. Это физиологическая характеристика человека, неотъемлемая часть личности. Но в некоторых ситуациях использование может быть запрещено. Например, когда диктор записывает текст на радио или когда у исполнителя есть права на образ и личность. В такой ситуации использование голоса без разрешения может нарушать права конкретного артиста.
Однако вы можете постараться максимально описать голос Адель, чтобы нейросеть сгенерировала приближенный к её тембру вариант. Это может выглядеть так: «Глубокий и мощный женский вокал, богатый и душевный, хрипловатый и страстный».
Определитесь с текстом
Вы можете либо вставить стихи, либо попросить нейросеть создать свой вариант. Учтите, что AI лучше генерит на английском, чем на русском.
После того как вы задали весь промпт, нейросеть представит вам на выбор несколько версий трека.
Как правильно опубликовать трек и не потерять деньги
Генерация случилась, трек нравится вам и вашему окружению. Что дальше?
Скачивайте музыку в формате WAV или FLAC, а не MP3. Стриминги любят качество. Выберите агрегатор, который доставит композицию на все площадки: VK Music, Zvuk, «Яндекс Музыку», ADV и KION. В России с ИИ-треками работают, например, Zvonko, Sferum, Yourtunēs и другие.
Релиз может быть размещён как на российских, так и на зарубежных платформах — в зависимости от условий распространения. Однако публикация на международных площадках поддерживается не всеми дистрибьюторами, поскольку многие зарубежные сервисы ограничивают или блокируют генеративный контент. Поэтому в большинстве случаев релизы с использованием нейросетей публикуются только российскими ресурсами.
Условия распространения, список доступных площадок и требования к ИИ-контенту стоит уточнять у конкретного дистрибьютора.
Как правильно оформить релиз с использованием ИИ
Он оформляется по тем же правилам, что и обычный: релиз должен соответствовать требованиям площадок к метаданным и обложкам, а также законодательству в части авторского права и содержания контента. При этом для ИИ-контента существуют дополнительные требования.
Не упоминайте нейросети в метаданных
Стриминговые площадки не допускают таких упоминаний в следующих элементах релиза:
- название трека или релиза;
- имя исполнителя;
- версия трека/релиза;
- лейбл;
- автор текста;
- композитор;
- обложка.
Подобные пометки могут привести к отклонению релиза или ограничению публикации на площадках.
Укажите авторов
Использование AI-инструментов не запрещает указывать себя как автора итогового произведения, даже если релиз был создан с помощью нейросетей.
Не игнорируйте требования к тексту песни
При загрузке текста важно удалить все технические и служебные элементы. Он не должен содержать:
- описание промпта для генерации текста ИИ;
- служебные обозначения структуры: [Куплет], [Припев], Bridge и тому подобное;
- указания на авторов, исполнителей или участников записи внутри текста;
- лишние символы и служебные пометки, не относящиеся к тексту песни.
Чем чище и естественнее оформлен релиз, тем выше вероятность успешной модерации и загрузки на площадки.
Основные ИИ-сервисы наделяют статусом правообладателя пользователя с платной подпиской. При загрузке трека на сервис права на AI-музыку дополнительно подтверждать не нужно — их может запросить дистрибьютор, в случае если на контент поступают жалобы. Отклонить AI-релиз площадка может только при нарушении прав третьих лиц. Например, если вы сгенерили ремикс на Билана, не получив разрешения правообладателя. Риски здесь — от блокировки до иска на сумму от 10 тысяч до 10 миллионов рублей.
Илья Чамуха
Руководитель Sample Legal



















Станьте первым, кто оставит комментарий