Η Google φτιάχνει ένα AI που μετατρέπει τις περιγραφές κειμένου σε μουσική

click fraud protection

Η Google παρουσίασε λεπτομερώς ένα bot AI που μπορεί να δημιουργήσει μουσική από εισαγωγές κειμένου. Ονομάζεται MusicLM, μπορεί ακόμη και να δημιουργήσει ολόκληρα τραγούδια με ανθρώπινα φωνητικά.

Google εργάζεται σε ένα Όλα συμπεριλαμβάνονται κάλεσε το bot MusicLM που μπορεί να δημιουργήσει μουσική από απλές εισαγωγές κειμένου. Η τεχνητή νοημοσύνη έχει εισέλθει στη συνείδηση ​​του κοινού τα τελευταία χρόνια, αλλά τα πράγματα εξερράγησαν πέρυσι την αποκάλυψη του ChatGPT του Open AI. Το chatbot μπορεί να κάνει πολλά πράγματα, όπως να γράφει ιστορίες, να δημιουργεί πρωτότυπα αστεία, να εξηγεί περίπλοκα επιστημονικά θέματα, να λύνει μαθηματικά προβλήματα και ακόμη και να προσφέρει θεραπεία, μεταξύ άλλων.

Η Google δημιούργησε ένα ρομπότ AI που ονομάζεται MusicLM που η εταιρεία ισχυρίζεται ότι μπορεί να δημιουργήσει μουσική υψηλής πιστότητας από περιγραφές κειμένου ή αποσπάσματα ήχου και να δημιουργήσει τραγούδια με βάση συγκεκριμένα είδη και στυλ που αναφέρει ο χρήστης. Μπορεί επίσης να χρησιμοποιήσει μια μελωδία με βουητό ή σφύριγμα. Σε ένα

ερευνητική εργασία, είπαν οι ερευνητές της Google, "Το MusicLM εκπέμπει τη διαδικασία παραγωγής μουσικής υπό όρους ως ιεραρχική εργασία μοντελοποίησης ακολουθίας σε ακολουθία και παράγει μουσική στα 24 kHz που παραμένει σταθερή για αρκετά λεπτά." Οι ερευνητές λένε επίσης ότι το bot μπορεί να τηρήσει τα κριτήρια εισαγωγής καλύτερα από οποιοδήποτε άλλο υπάρχουσα τεχνητή νοημοσύνη που παράγει μουσική, και μάλιστα να τους ξεπεράσει σε ποιότητα ήχου.

Μουσική που δημιουργείται από AI

Η Google ανέβασε ένα σωρό αποσπάσματα ήχου που λέγεται ότι έχουν δημιουργηθεί χρησιμοποιώντας το MusicLM. Το AI δημιούργησε τα ηχητικά κλιπ διάρκειας 30 δευτερολέπτων με περιγραφές που περιλαμβάνουν ένα είδος ή συγκεκριμένα όργανα. Μερικά από τα 5 λεπτά κλιπ δημιουργήθηκαν εξ ολοκλήρου με περιγραφές μιας ή δύο λέξεων, όπως «μελωδική techno», «swing» ή «χαλαρωτική τζαζ». Τα αποτελέσματα δεν είναι πιθανό να κάνουν κανέναν να ξεχάσει τον Μπετόβεν ή τον Μότσαρτ, αλλά ακούγονται αρκετά φυσικά ώστε να είναι σχεδόν αδύνατο να πιστέψει κανείς ότι οι άνθρωποι συνθέτες δεν έγραψαν τους.

Μαζί με τις προτροπές κειμένου, το MusicLM μπορεί επίσης να λάβει οδηγίες χρησιμοποιώντας εικόνες. Οι χρήστες μπορούν να ρυθμίσουν τα επίπεδα εμπειρίας του μουσικού AI για να ρυθμίσουν με ακρίβεια την ποιότητα εξόδου. Το bot μπορεί ακόμη και να δημιουργήσει μουσική εμπνευσμένη από μέρη και να του ζητηθεί να δημιουργήσει μουσική για συγκεκριμένες δραστηριότητες, όπως ο διαλογισμός ή η προπόνηση. Το MusicLM μπορεί να δημιουργήσει ανθρώπινα φωνητικά, αλλά ακούγονται παραμορφωμένα, με αγγλικούς στίχους που ακούγονται περισσότερο σαν μια λέξη σαλάτα παρά με ένα πραγματικό τραγούδι. Ο Ed Sheeran και η Taylor Swift δεν χρειάζεται να ανησυχούν ακόμα για τον επικείμενο ανταγωνισμό.

Το MusicLM απέχει πολύ από την πρώτη σύγχρονη γεννήτρια μουσικής AI. Προηγούμενες προσπάθειες περιλαμβάνουν το Riffusion, το Dance Diffusion και το Jukebox του OpenAI, αλλά καμία από αυτές δεν έχει παράγει αποτελέσματα τόσο τρομακτικά εντυπωσιακά όσο το MusicLM. Με περισσότερο χρόνο και εκπαιδευτικό υλικό, η νέα τεχνητή νοημοσύνη θα μπορούσε να γίνει ακόμα πιο ρεαλιστική και «ανθρώπινη», αλλά Αυτό θα μπορούσε επίσης να φέρει την Google σε νομικά προβλήματα με τους μουσικούς να χρησιμοποιούν τη μουσική τους για την εκπαίδευση του AI μοντέλο. Αυτό ακριβώς συνέβη πρόσφατα όταν τρεις εξέχοντες καλλιτέχνες μήνυσαν το Stability AI, Midjourney και DeviantArt για εικαζόμενες παραβιάσεις πνευματικών δικαιωμάτων. Παρά τα πιθανά νομικά προβλήματα, είναι πιθανό μόνο θέμα χρόνου MusicLM έρχεται με δημιουργίες που πραγματικά δεν διακρίνονται από τη μουσική που δημιουργούν άνθρωποι συνθέτες.

Πηγή: Google/GitHub, arXiv