Google създава AI, който превръща текстовите описания в музика

click fraud protection

Google описа подробно AI бот, който може да създава музика от въведен текст. Наречен MusicLM, той дори може да генерира цели песни с човешки вокали.

Google работи върху AI бот се обади MusicLM които могат да създават музика от прости текстови входове. AI навлиза в общественото съзнание през последните няколко години, но нещата експлодираха миналата година с разкриването на Open AI's ChatGPT. Чатботът може да прави множество неща, като писане на истории, генериране на оригинални вицове, обясняване на сложни научни теми, решаване на математически задачи и дори предлагане на терапия, наред с други неща.

Google създаде AI бот, наречен MusicLM че компанията твърди, че може да генерира висококачествена музика от текстови описания или звукови фрагменти и да създава песни въз основа на конкретни жанрове и стилове, които потребителят споменава. Може също да използва тананикаща или подсвиркваща мелодия. В изследователска работа, казаха изследователите на Google, „MusicLM преобразува процеса на условно генериране на музика като задача за моделиране на йерархична последователност към последователност и генерира музика при 24 kHz, която остава постоянна за няколко минути.“

Изследователите също така казват, че ботът може да се придържа към критериите за въвеждане по-добре от всеки друг съществуващ AI за продуциране на музика, и дори ги превъзхождат по отношение на качеството на звука.

Музика, генерирана от AI

Google качи куп аудио фрагменти, за които се твърди, че са създадени с помощта на MusicLM. AI генерира 30-секундни аудио клипове с описания, които включват жанр или специфични инструменти. Някои от 5-минутните клипове са създадени изцяло въз основа на описания от една или две думи, като „мелодично техно“, „суинг“ или „релаксиращ джаз“. Резултатите няма вероятност да накарат някой да забрави Бетовен или Моцарт, но звучат достатъчно естествено, за да направят почти невъзможно да се повярва, че човешките композитори не са писали тях.

Заедно с текстови подкани, MusicLM може също да получава инструкции с помощта на снимки. Потребителите могат да задават нивата на опит на AI музиканта, за да настроят фино качеството на изхода. Ботът може дори да създава музика, вдъхновена от места и да бъде помолен да създава музика за определени дейности, като медитация или тренировки. MusicLM може да генерира човешки вокали, но те звучат изкривено, с английски текстове, които звучат повече като салата от думи, отколкото като истинска песен. Ед Шийрън и Тейлър Суифт все още не трябва да се тревожат за предстоящото състезание.

MusicLM далеч не е първият модерен AI музикален генератор. По-ранните опити включват Riffusion, Dance Diffusion и Jukebox на OpenAI, но никой от тях не е довел до толкова впечатляващи резултати, колкото MusicLM. С повече време и обучителни материали, новият AI може да стане още по-реалистичен и „подобен на човека“, но това също може да накара Google да се сблъска със съдебни проблеми с музикантите, които използват тяхната музика за обучение на AI модел. Точно това се случи наскоро, когато трима видни художници съдиха Stability AI, Midjourney и DeviantArt за предполагаеми нарушения на авторски права. Независимо от потенциалните правни проблеми, вероятно е само въпрос на време MusicLM създава творения, които са наистина неразличими от музиката, създадена от човешки композитори.

източник: Google/GitHub, arXiv