Google entwickelt eine KI, die Textbeschreibungen in Musik umwandelt

click fraud protection

Google hat einen KI-Bot detailliert beschrieben, der Musik aus Texteingaben erstellen kann. Es heißt MusicLM und kann sogar ganze Songs mit menschlichem Gesang generieren.

Google arbeitet an einer KI Bot hat angerufen MusikLM die aus einfachen Texteingaben Musik machen können. KI ist in den letzten Jahren ins öffentliche Bewusstsein getreten, aber letztes Jahr explodierte die Situation die Enthüllung von ChatGPT von Open AI. Der Chatbot kann eine Vielzahl von Dingen tun, unter anderem Geschichten schreiben, originelle Witze erfinden, komplexe wissenschaftliche Themen erklären, mathematische Probleme lösen und sogar Therapien anbieten.

Google hat einen KI-Bot namens erstellt MusikLM dass das Unternehmen behauptet, High-Fidelity-Musik aus Textbeschreibungen oder Soundschnipseln generieren und Songs basierend auf bestimmten Genres und Stilen erstellen zu können, die der Benutzer erwähnt. Es kann auch eine gesummte oder gepfiffene Melodie verwendet werden. In einem Forschungsbericht, sagten Google-Forscher,

„MusicLM stellt den Prozess der bedingten Musikerzeugung als eine hierarchische Sequenz-zu-Sequenz-Modellierungsaufgabe dar und erzeugt Musik bei 24 kHz, die über mehrere Minuten konstant bleibt.“ Die Forscher sagen auch, dass der Bot die Eingabekriterien besser einhalten kann als jeder andere bestehende musikproduzierende KI, und übertreffen sie sogar in Bezug auf die Audioqualität.

KI-generierte Musik

Google hat eine Reihe von Audioschnipseln hochgeladen, die angeblich mit MusicLM erstellt wurden. Die KI generierte die 30-Sekunden-Audioclips mit Beschreibungen, die ein Genre oder bestimmte Instrumente enthalten. Einige der 5-minütigen Clips wurden vollständig auf der Grundlage von Ein- oder Zwei-Wort-Beschreibungen wie „melodischer Techno“, „Swing“ oder „entspannender Jazz“ erstellt. Die Ergebnisse werden niemanden Beethoven oder Mozart vergessen lassen, aber sie klingen so natürlich, dass es fast unmöglich ist zu glauben, dass menschliche Komponisten nicht geschrieben haben ihnen.

Neben Textaufforderungen kann MusicLM auch Anweisungen mit Bildern erhalten. Benutzer können die Erfahrungsstufen des KI-Musikers einstellen, um die Ausgabequalität zu optimieren. Der Bot kann sogar von Orten inspirierte Musik erstellen und aufgefordert werden, Musik für bestimmte Aktivitäten zu erstellen. wie Meditation oder Workouts. MusicLM kann menschliche Vocals erzeugen, aber sie klingen verzerrt, mit englischen Texten, die eher wie ein Wortsalat als wie ein richtiges Lied klingen. Ed Sheeran und Taylor Swift müssen sich noch keine Gedanken über bevorstehende Konkurrenz machen.

MusicLM ist weit davon entfernt, der erste moderne KI-Musikgenerator zu sein. Frühere Versuche umfassen Riffusion, Dance Diffusion und die Jukebox von OpenAI, aber keiner von ihnen hat so beängstigend beeindruckende Ergebnisse hervorgebracht wie MusicLM. Mit mehr Zeit und Trainingsmaterial könnte die neue KI aber noch realistischer und „menschenähnlicher“ werden Das könnte Google auch in rechtliche Schwierigkeiten mit Musikern bringen, die ihre Musik nicht zum Trainieren der KI verwenden Modell. Genau das ist kürzlich passiert, als Drei prominente Künstler verklagten Stability AI, Midjourney und DeviantArt wegen angeblicher Urheberrechtsverletzungen. Ungeachtet möglicher rechtlicher Probleme ist es wahrscheinlich nur eine Frage der Zeit, bis dies der Fall ist MusikLM kommt mit Kreationen, die wirklich nicht von der Musik menschlicher Komponisten zu unterscheiden sind.

Quelle: Google/GitHub, arXiv