Facebook Melatih AI Dalam Tampilan Orang Pertama. Ini Cerdas & Mengkhawatirkan

click fraud protection

Facebook telah mengumumkan proyek penelitian baru bernama Ego4D yang bertujuan untuk melatih model AI menggunakan video yang diambil dari a perspektif manusia dan kemudian memberikan panduan menggunakan isyarat augmented reality dengan mengakses log masa lalu rekaman. Proyek penelitian AI-centric raksasa media sosial terbaru menempatkan teknologi visi komputer di depan dan di tengah, yang sudah digunakan untuk beberapa sejauh mana produk seperti Google Lens dan beberapa alat belanja lainnya tempat gambar dipelajari untuk menarik daftar serupa dari e-niaga platform.

Perusahaan baru-baru ini merinci pekerjaannya pada yang baru Alat pencarian visual dan penemuan produk bertenaga AI yang akan meningkatkan pengalaman berbelanja di Instagram. Di ujung jalan, itu akan menarik daftar item pakaian online hanya dengan mengetuk foto seseorang. Sistem pengenalan produk internal sangat canggih sehingga akan menarik produk yang relevan bahkan untuk kueri berbasis teks yang tidak jelas seperti "temukan kemeja dengan pola polka dot serupa" di platformnya. Tetapi semua sistem pengenalan objek ini sebagian besar didasarkan pada sistem visi komputer yang dilatih pada foto dan video yang diambil dari perspektif orang ketiga.

Facebook melangkah lebih jauh dengan mengubah perspektif data pelatihan dari sela-sela menjadi langsung ke tengah aksi dengan perspektif orang pertama sebagai bagian dari Ego4D AI-nya proyek. Kemungkinannya tampaknya bermanfaat tanpa henti, dan juga sedikit menakutkan. Untuk mengumpulkan data pelatihan, Facebook bermitra dengan 13 institusi di sembilan negara yang merekrut lebih dari 700 peserta untuk mencatat lebih banyak dari 2.200 jam rekaman orang pertama yang mendokumentasikan kegiatan sehari-hari seperti berbelanja bahan makanan, mencuci peralatan, dan bermain drum. sedikit. Tujuannya adalah untuk menangkap aktivitas dan juga menilai skenario dari sudut pandang seseorang, seperti tindakan yang direkam oleh Kacamata hitam Ray-Ban Stories milik Facebook sendiri.

Sekilas Metaverse Pertama Dengan AR Di Pusat

Perusahaan menyebutnya persepsi egosentris, maka nama Ego4D. Video tersebut ditranskripsi dan diberi anotasi untuk menggambarkan segala sesuatu dalam bingkai dari objek ke tindakan, untuk membuat kumpulan data yang dapat digunakan para peneliti di seluruh dunia untuk mengembangkan sistem visi komputer dan mengkatalisasi gelombang baru pengembangan AI. Wendy baru-baru ini bermitra dengan Google Cloud untuk membuat satu sistem visi komputer yang akan memantau dapur dan beri tahu juru masak saat waktunya membalik burger. Namun, proyek Ego4D Facebook menempatkan putaran AR pada kemampuan AI yang jauh melampaui analisis dan benar-benar melangkah ke ranah memprediksi tindakan pengguna.

Untuk melakukan itu, Facebook telah menyulap serangkaian lima tolok ukur yang harus dicapai oleh persepsi egosentris AI. Yang pertama adalah memori episodik, yang bekerja dengan cara yang sama seperti memori manusia. Misalnya, ketika pengguna lupa di mana mereka meletakkan remote TV, AI akan mengakses video orang pertama sebelumnya untuk memeriksa di mana pengguna meninggalkannya, dan kemudian akan memandu mereka menuju tempat tersebut menggunakan isyarat AR. agak seperti Apple Maps. Tolok ukur kedua adalah peramalan, yang memprediksi apa yang akan dilakukan pengguna dan memberikan peringatan yang diperlukan. Jadi, jika pengguna telah menambahkan merica ke dalam kari mereka, dan kembali meraih botol bubuk merica, AI akan mengenali tindakan yang akan datang dan akan langsung memberi tahu pengguna bahwa bahannya sudah ada ditambahkan.

Kami mengumumkan #Ego4D, sebuah proyek jangka panjang yang ambisius yang telah kami mulai dengan 13 universitas di 9 negara untuk memajukan persepsi orang pertama. Pekerjaan ini akan mengkatalisasi penelitian untuk membangun asisten AI, robot & inovasi masa depan lainnya yang lebih berguna. https://t.co/oJSxptBo52pic.twitter.com/PaxP4n53C5

— Facebook AI (@facebookai) 14 Oktober 2021

Demikian pula, 'manipulasi tangan dan objek' benchmark ingin AI mengingat urutan kejadian yang benar, sesuatu yang akan membantu siswa karena isyarat AR akan menunjukkan kepada mereka langkah-langkah dalam video pelatihan yang direkam. Tolok ukur keempat adalah interaksi sosial, sedangkan yang kelima — dan yang paling mengkhawatirkan — adalah diarisasi audio visual. Yang ini melibatkan penyimpanan log audio (dan mungkin juga berbasis teks) dari apa yang dikatakan seseorang dalam tampilan kamera. Pengguna kemudian dapat mengajukan pertanyaan AI seperti apa yang dikatakan orang ABC selama rehat kopi mereka pada hari tertentu. Facebook belum merinci perlindungan terhadap skenario intrusi privasi yang tampaknya masif untuk proyeknya. NS Cerita Ray-Ban telah mendapat sorotan karena kemampuan mereka untuk masuk ke mode creep penuh. Dan dengan AI secerdas Ego4D, akan ada lebih banyak kekhawatiran terkait privasi.

Sisi positifnya, proyek Ego4D memberikan pandangan yang sangat jelas tentang apa yang ingin dicapai Facebook dengan metaverse, setidaknya dalam hal membantu pengguna dalam kehidupan sehari-hari mereka. Dan penerapan augmented reality yang berat untuk mencapai tujuan tersebut adalah tanda bahwa Facebook akan menggunakan AR dan perangkat yang dapat dikenakan yang lebih canggih pasti ada di dalam pipa. Tetapi pertanyaan terbesar adalah apakah pengguna akan merasa nyaman dengan Facebook memiliki lebih banyak akses pribadi ke kehidupan mereka melalui video orang pertama, mengingat masa lalu perusahaan yang samar dengan skandal terkait privasi.

Sumber: Facebook

FTC Siap Mengambil Tindakan Atas Ulasan Palsu, Memperingatkan 100-an Perusahaan

Tentang Penulis