جوجل يصنع ذكاءً اصطناعيًا يحول أوصاف النص إلى موسيقى

click fraud protection

قامت Google بتفصيل روبوت AI يمكنه إنشاء موسيقى من مدخلات النص. يطلق عليه MusicLM ، ويمكنه حتى إنشاء أغانٍ كاملة بأغاني بشرية.

جوجل يعمل على منظمة العفو الدولية دعا بوت MusicLM يمكنه إنشاء موسيقى من إدخالات نصية بسيطة. لقد دخل الذكاء الاصطناعي إلى الوعي العام على مدار السنوات العديدة الماضية ، لكن الأمور انفجرت العام الماضي كشف النقاب عن ChatGPT الخاص بـ Open AI. يمكن لبرنامج chatbot القيام بعدد كبير من الأشياء ، مثل كتابة القصص ، وتوليد النكات الأصلية ، وشرح الموضوعات العلمية المعقدة ، وحل المشكلات الرياضية ، وحتى تقديم العلاج ، من بين أشياء أخرى.

قامت Google بإنشاء روبوت AI يسمى MusicLM التي تدعي الشركة أنها يمكن أن تولد موسيقى عالية الدقة من أوصاف نصية أو مقتطفات صوتية ، وإنشاء أغانٍ بناءً على أنواع وأنماط معينة يذكرها المستخدم. ويمكنه أيضًا استخدام نغمة متواضعة أو صفارة. في ورقة ابحاثقال باحثو Google ، "يلقي MusicLM عملية توليد الموسيقى الشرطي كمهمة نمذجة تسلسل إلى تسلسل هرمي ، ويولد موسيقى عند 24 كيلو هرتز تظل ثابتة على مدار عدة دقائق." يقول الباحثون أيضًا أن الروبوت يمكنه الالتزام بمعايير الإدخال بشكل أفضل من أي شيء آخر

منظمة العفو الدولية الحالية المنتجة للموسيقىبل ويتفوق عليهم من حيث جودة الصوت.

الموسيقى المولدة بالذكاء الاصطناعي

قامت Google بتحميل مجموعة من المقتطفات الصوتية التي قيل إنها تم إنشاؤها باستخدام MusicLM. أنتج الذكاء الاصطناعي مقاطع صوتية مدتها 30 ثانية مع أوصاف تتضمن نوعًا أو آلات محددة. تم إنشاء بعض المقاطع التي يبلغ طولها 5 دقائق استنادًا إلى وصف مكون من كلمتين أو كلمتين ، مثل "لحني تكنو" أو "سوينغ" أو "موسيقى جاز مريحة". النتائج من غير المحتمل أن تجعل أي شخص ينسى بيتهوفن أو موتسارت ، لكن يبدو أنهما طبيعيان بدرجة تجعل من المستحيل تقريبًا تصديق أن الملحنين البشريين لم يكتبوا هم.

إلى جانب المطالبات النصية ، يمكن لـ MusicLM أيضًا تلقي التعليمات باستخدام الصور. يمكن للمستخدمين ضبط مستويات الخبرة لموسيقي الذكاء الاصطناعي لضبط جودة الإخراج. يستطيع الروبوت أيضًا إنشاء موسيقى مستوحاة من الأماكن ويطلب منه إنشاء موسيقى لأنشطة معينة ، مثل التأمل أو التدريبات. يمكن أن تولد MusicLM أصواتًا بشرية ، لكنها تبدو مشوهة ، مع كلمات إنجليزية تبدو وكأنها سلطة كلمة أكثر من أغنية حقيقية. لا داعي للقلق من إد شيران وتايلور سويفت بشأن المنافسة الوشيكة حتى الآن.

MusicLM بعيد كل البعد عن كونه أول مولد موسيقى حديث بتقنية الذكاء الاصطناعي. تضمنت المحاولات السابقة Riffusion ، و Dance Diffusion ، و Jukebox من OpenAI ، ولكن لم ينتج عن أي منها نتائج مثيرة للإعجاب مثل MusicLM. مع مزيد من الوقت والمواد التدريبية ، يمكن أن يصبح الذكاء الاصطناعي الجديد أكثر واقعية و "شبيه بالبشر" ، لكن قد يؤدي ذلك أيضًا إلى وقوع Google في مشكلة قانونية مع الموسيقيين بسبب استخدام موسيقاهم لتدريب الذكاء الاصطناعي نموذج. هذا بالضبط ما حدث مؤخرًا عندما رفع ثلاثة فنانين بارزين دعوى قضائية ضد شركة Stability AIو Midjourney و DeviantArt لانتهاكات حقوق النشر المزعومة. على الرغم من المشاكل القانونية المحتملة ، فمن المحتمل أن تكون مسألة وقت فقط من قبل MusicLM يأتي بإبداعات لا يمكن تمييزها حقًا عن الموسيقى التي أنشأها الملحنون البشريون.

مصدر: جوجل / جيثب, arXiv