Google loob tehisintellekti, mis muudab tekstikirjeldused muusikaks

click fraud protection

Google on üksikasjalikult kirjeldanud AI-botit, mis suudab tekstisisenditest muusikat luua. Seda nimetatakse MusicLM-iks ja see võib genereerida isegi terveid lugusid inimese vokaaliga.

Google töötab an AI bot kutsus MuusikaLM mis suudab luua muusikat lihtsate tekstisisendite abil. AI on viimastel aastatel avalikkuse teadvusesse jõudnud, kuid eelmisel aastal läksid asjad plahvatuslikult Open AI ChatGPT avalikustamine. Vestlusbot saab muu hulgas teha paljusid asju, näiteks kirjutada lugusid, genereerida originaalseid nalju, selgitada keerulisi teaduslikke teemasid, lahendada matemaatikaülesandeid ja isegi pakkuda teraapiat.

Google on loonud tehisintellekti roboti nimega MuusikaLM et ettevõte väidab, et suudab tekstikirjelduste või helijuppide põhjal luua ülitäpset muusikat ning luua laule, mis põhinevad konkreetsetel žanritel ja stiilidel, mida kasutaja mainib. See võib kasutada ka ümisevat või vilistatavat meloodiat. Sees uurimustöö, ütlesid Google'i teadlased, "MusicLM kasutab tingimusliku muusika genereerimise protsessi hierarhilise jada-jada modelleerimise ülesandena ja genereerib muusikat sagedusel 24 kHz, mis püsib mitme minuti jooksul ühtlane."

Teadlased ütlevad ka, et bot suudab sisendkriteeriume paremini järgida kui ükski teine olemasolevat muusikat tootvat tehisintellektija isegi edestavad neid helikvaliteedi poolest.

AI loodud muusika

Google on üles laadinud hulga helilõike, mis väidetavalt on loodud MusicLM-i abil. AI genereeris 30-sekundilised heliklipid koos kirjeldustega, mis sisaldavad žanri või konkreetseid instrumente. Mõned 5-minutilised klipid loodi täielikult ühe- või kahesõnaliste kirjelduste põhjal, nagu "meloodiline tehno", "sving" või "lõõgastav jazz". Tulemused ei pane tõenäoliselt kedagi Beethovenit või Mozartit unustama, kuid need kõlavad piisavalt loomulikult, et oleks peaaegu võimatu uskuda, et inimheliloojad pole kirjutanud neid.

Lisaks tekstiviipadele saab MusicLM saada juhiseid ka piltide abil. Kasutajad saavad väljundkvaliteedi täpsustamiseks määrata AI-muusiku kogemuse taseme. Bot võib isegi luua muusikat, mis on inspireeritud kohtadest, ja tal palutakse luua muusikat teatud tegevuste jaoks, nagu meditatsioon või treeningud. MusicLM võib tekitada inimese vokaali, kuid need kõlavad moonutatult ning ingliskeelsed sõnad kõlavad pigem sõnasalatina kui päris lauluna. Ed Sheeran ja Taylor Swift ei pea veel eelseisva konkurentsi pärast muretsema.

MusicLM on kaugel esimesest kaasaegsest AI muusikageneraatorist. Varasemate katsete hulka kuuluvad Riffusion, Dance Diffusion ja OpenAI Jukebox, kuid ükski neist pole andnud nii kohutavalt muljetavaldavaid tulemusi kui MusicLM. Rohkema aja ja koolitusmaterjaliga võib uus tehisintellekt muutuda veelgi realistlikumaks ja „inimlikuks”, kuid mis võib viia Google'i juriidilistesse probleemidesse, kuna muusikud kasutavad nende muusikat tehisintellekti koolitamiseks mudel. Täpselt nii juhtus hiljuti, kui kolm silmapaistvat kunstnikku kaebasid Stability AI kohtusse, Midjourney ja DeviantArt väidetavate autoriõiguste rikkumiste eest. Vaatamata võimalikele juriidilistele probleemidele on see tõenäoliselt vaid aja küsimus MuusikaLM tuleb välja loominguga, mis on tõeliselt eristamatu inimheliloojate loodud muusikast.

Allikas: Google/GitHub, arXiv