Facebook, Yapay Zekayı Birinci Şahıs Görünümünde Eğitiyor. Akıllı ve Alarm Veren

click fraud protection

Facebook Ego4D adlı yeni bir araştırma projesini duyurdu. insan perspektifi ve ardından geçmişin günlüğüne erişerek artırılmış gerçeklik ipuçlarını kullanarak rehberlik sağlamak kayıtlar. Sosyal medya devinin en son AI merkezli araştırma projesi, bazılarının zaten kullandığı bilgisayarlı görme teknolojisini öne ve merkeze koyuyor. Google Lens gibi ürünler ve e-ticaretten benzer listeleri çekmek için bir görselin incelendiği bir avuç başka alışveriş aracı için kapsam platformlar.

Şirket yakın zamanda çalışmalarını yeni Yapay zeka destekli görsel arama ve ürün keşif araçları Bu, Instagram'daki alışveriş deneyimini artıracak. Yolun aşağısında, sadece bir kişinin fotoğrafına dokunarak çevrimiçi giyim eşyası listelerini çekecek. Şirket içi ürün tanıma sistemi o kadar gelişmiş ki, platformlarında “benzer puantiyeli bir gömlek bul” gibi belirsiz metin tabanlı sorgular için bile ilgili ürünleri çekecek. Ancak tüm bu nesne tanıma sistemleri, ağırlıklı olarak, üçüncü şahıs bakış açısıyla çekilen fotoğraflar ve videolar üzerinde eğitilmiş bir bilgisayar görme sistemine dayanmaktadır.

Facebook, Ego4D AI'nın bir parçası olarak birinci şahıs bakış açısıyla eğitim verilerinin perspektifini kenardan hareketin ortasına değiştirerek bir adım daha ileri gidiyor. proje. Olasılıklar sonsuz derecede faydalı ve biraz da korkutucu görünüyor. Eğitim verilerini toplamak için Facebook, daha fazla kayıt için 700'den fazla katılımcıyı işe alan dokuz ülkede 13 kurumla ortaklık kurdu. bakkal alışverişi, bulaşık yıkamak ve davul çalmak gibi günlük aktiviteleri belgeleyen 2.200 saatten fazla birinci şahıs görüntüsü. bir kaç. Amaç, faaliyetleri yakalamak ve senaryoyu, tıpkı bir kişi tarafından kaydedilen eylem gibi, bir kişinin kendi perspektifinden değerlendirmektir. Facebook'un kendi Ray-Ban Stories güneş gözlüğü.

Merkezde AR Olan Metaverse'e İlk Bakış

Şirket buna benmerkezci algı diyor, dolayısıyla Ego4D adı. Video, bir nesneden eyleme kadar çerçevedeki her şeyi betimlemek için kopyalandı ve açıklama eklendi. Dünyanın dört bir yanındaki araştırmacıların bilgisayarlı görü sistemleri geliştirmek ve yeni bir yapay zeka geliştirme dalgasını katalize etmek için kullanabileceği veri kümesi. Wendy's, kısa süre önce mutfağı izleyecek ve hamburgerleri çevirme zamanı geldiğinde aşçıyı uyar. Bununla birlikte, Facebook'un Ego4D projesi, analizin çok ötesine geçen ve aslında kullanıcıların eylemlerini tahmin etme alanına adım atan AI yeteneklerine bir AR dönüşü getiriyor.

Bunu yapmak için Facebook, benmerkezci bir AI algısının başarması gereken beş kriter kümesi oluşturdu. Birincisi, insan hafızasıyla aynı şekilde çalışan epizodik hafızadır. Örneğin, kullanıcılar TV uzaktan kumandasını nereye koyduklarını unuttuklarında, AI, kullanıcıların uzaktan kumandayı nerede bıraktığını kontrol etmek için geçmiş birinci şahıs videolarına erişecek ve ardından AR ipuçlarını kullanarak onları yere doğru yönlendirecektir. biraz Apple Haritalar gibi. İkinci kriter, kullanıcının ne yapmak üzere olduğunu tahmin eden ve gerekli uyarıyı sağlayan tahmindir. Bu nedenle, bir kullanıcı körisine zaten biber eklediyse ve tekrar biber tozu şişesine uzanırsa, AI, yaklaşan eylemi algılayacak ve içeriğin zaten hazır olduğu konusunda kullanıcıları anında uyaracaktır. katma.

duyuruyoruz #Ego4D, birinci şahıs algısını geliştirmek için 9 ülkede 13 üniversiteyle başlattığımız iddialı uzun vadeli bir proje. Bu çalışma, daha kullanışlı yapay zeka asistanları, robotlar ve gelecekteki diğer yenilikleri oluşturmak için araştırmaları hızlandıracak. https://t.co/oJSxptBo52pic.twitter.com/PaxP4n53C5

- Facebook AI (@facebookai) 14 Ekim 2021

Benzer şekilde, 'el ve nesne manipülasyonu' benchmark, AI'nın doğru bir olay dizisini hatırlamasını istiyor; bu, AR ipuçları onlara kayıtlı bir eğitim videosundaki adımları göstereceği için öğrencilerin yararlı bulacağı bir şey. Dördüncü kriter sosyal etkileşim iken, beşinci - ve en endişe verici olanı - sesli görsel günlükleştirme. Bu, kameranın görüşündeki bir kişinin söylediklerinin sesli (ve muhtemelen metin tabanlı) bir günlüğünü kaydetmeyi içerir. Kullanıcılar daha sonra, belirli bir günde ABC'nin kahve molası sırasında ne söylediği gibi AI sorularını sorabilir. Facebook, projesi için görünüşte çok büyük gizlilik ihlali senaryolarına yönelik önlemleri henüz ayrıntılı olarak açıklamadı. NS Ray-Ban Hikayeleri şimdiden inceleme altına alındı tam sürünme moduna geçme yetenekleri nedeniyle. Ve Ego4D kadar akıllı bir AI ile gizlilikle ilgili çok daha fazla endişe olacak.

Olumlu tarafı, Ego4D projesi çok net bir fikir veriyor. Facebook'un meta veri deposuyla başarmak istediği şey, en azından kullanıcılara günlük yaşamlarında yardımcı olmak söz konusu olduğunda. Ve bu hedeflere ulaşmak için artırılmış gerçekliğin yoğun bir şekilde uygulanması, Facebook'un AR üzerinde her şeyi yapacağının ve daha gelişmiş giyilebilir cihazların kesinlikle boru hattında olduğunun bir işaretidir. Ancak en büyük soru, kullanıcıların bu konuda rahat olup olmayacağıdır. Facebook Şirketin gizlilikle ilgili skandallarla dolu yarım yamalak geçmişi göz önüne alındığında, birinci şahıs videoları aracılığıyla hayatlarına daha fazla kişisel erişime sahip olmak.

Kaynak: Facebook

FTC Sahte İncelemeler Üzerine Harekete Geçmeye Hazır, 100'lerce Şirketi Uyardı

Yazar hakkında