Facebook usposablja AI v prvoosebnem pogledu. Je pametno in alarmantno

November 29, 2021
VTehnika Facebook

click fraud protection

Facebook je napovedal nov raziskovalni projekt, imenovan Ego4D, katerega cilj je usposobiti modele AI z uporabo videoposnetkov, posnetih iz človeško perspektivo in nato zagotavljanje navodil z uporabo namigov razširjene resničnosti z dostopom do dnevnika preteklosti posnetki. Najnovejši raziskovalni projekt velikana družbenih medijev, osredotočen na umetno inteligenco, postavlja tehnologijo računalniškega vida v ospredje in v središče, ki jo nekateri že uporabljajo obseg za izdelke, kot je Google Lens, in peščica drugih nakupovalnih orodij, kjer se slika preučuje, da iz e-trgovine izvleče podobne oglase platforme.

Podjetje je pred kratkim podrobno predstavilo svoje delo na novem Orodja za vizualno iskanje in odkrivanje izdelkov, ki jih poganja umetna inteligenca to bo izboljšalo nakupovalno izkušnjo na Instagramu. Po cesti bo prikazal spletne sezname oblačil, tako da preprosto tapnete fotografijo osebe. Notranji sistem za prepoznavanje izdelkov je tako napreden, da bo na svojih platformah poiskal ustrezne izdelke tudi za nejasne besedilne poizvedbe, kot je »poišči srajco s podobnim pikčastim vzorcem«. Toda vsi ti sistemi za prepoznavanje predmetov pretežno temeljijo na sistemu računalniškega vida, usposobljenem na fotografijah in videoposnetkih, posnetih iz perspektive tretje osebe.

Facebook gre še korak dlje, tako da spremeni perspektivo podatkov o vadbi s strani na naravnost v sredino dogajanja s prvoosebno perspektivo kot del svoje umetne inteligence Ego4D projekt. Zdi se, da so možnosti neskončno koristne in tudi malo strašljive. Za zbiranje podatkov o usposabljanju je Facebook sodeloval s 13 institucijami v devetih državah, ki so zaposlile več kot 700 udeležencev, da bi zabeležili več več kot 2200 ur prvoosebnih posnetkov, ki dokumentirajo vsakodnevne dejavnosti, kot so nakupovanje živil, pomivanje posode in igranje bobnov. malo. Cilj je zajeti dejavnosti in tudi oceniti scenarij z lastne perspektive, podobno kot dejanje, ki ga je zabeležil Facebookova lastna sončna očala Ray-Ban Stories.

Prvi pogled na Metaverse z AR v središču

Podjetje ga imenuje egocentrično dojemanje, od tod tudi ime Ego4D. Videoposnetek je bil prepisan in označen za opis vsega v kadru od predmeta do dejanja, da bi ustvarili nabor podatkov, ki ga lahko raziskovalci po vsem svetu uporabijo za razvoj sistemov računalniškega vida in katalizirajo nov val razvoja umetne inteligence. Wendy je pred kratkim sodelovala z Google Cloud, da bi ustvarila en tak sistem računalniškega vida, ki bo spremljal kuhinjo in opozorite kuharja, ko je čas, da obrnete burgerje. Vendar pa Facebookov projekt Ego4D postavlja AR na tiste zmožnosti umetne inteligence, ki daleč presegajo analizo in dejansko stopijo v področje napovedovanja dejanj uporabnikov.

Za to je Facebook pripravil nabor petih meril uspešnosti, ki jih mora doseči egocentrična percepcija AI. Prvi je epizodni spomin, ki deluje na enak način kot človeški spomin. Na primer, ko uporabniki pozabijo, kam so postavili daljinski upravljalnik televizorja, bo AI dostopala do preteklih prvoosebnih videoposnetkov, da bi preverila, kje so ga uporabniki pustili, in jih nato vodila proti kraju z uporabo AR namigov. nekoliko kot Apple Maps. Drugo merilo uspešnosti je napovedovanje, ki predvideva, kaj bo uporabnik naredil, in zagotavlja potrebno opozorilo. Torej, če je uporabnik že dodal poper svojemu curryju in spet poseže po steklenički s poper v prahu, AI bo prepoznala bližajoče se dejanje in bo takoj opozorila uporabnike, da je sestavina že bila dodano.

objavljamo #Ego4D, ambiciozen dolgoročni projekt, ki smo ga začeli s 13 univerzami v 9 državah, da bi izboljšali zaznavanje prve osebe. To delo bo kataliziralo raziskave za izgradnjo uporabnejših pomočnikov AI, robotov in drugih prihodnjih inovacij. https://t.co/oJSxptBo52pic.twitter.com/PaxP4n53C5
— Facebook AI (@facebookai) 14. oktober 2021

Podobno, "manipulacija z rokami in predmeti" Benchmark želi, da si AI zapomni pravilno zaporedje dogodkov, kar bo študentom v pomoč, saj jim bodo namigi AR pokazali korake v posnetem videoposnetku za usposabljanje. Četrto merilo uspešnosti je socialna interakcija, peto – in najbolj zaskrbljujoče – pa je avdio vizualna diarizacija. Ta vključuje shranjevanje zvočnega (in morda tudi besedilnega) dnevnika o tem, kaj je govorila oseba v pogledu kamere. Uporabniki lahko nato AI zastavljajo vprašanja, na primer, kaj je oseba ABC rekla med odmorom za kavo na določen dan. Facebook še ni podrobno opisal zaščitnih ukrepov za navidezno množične scenarije vdora v zasebnost za svoj projekt. The Zgodbe Ray-Ban so že bile pod drobnogledom zaradi njihove zmožnosti, da preidejo v način popolnega lezenja. In s tako pametno umetno inteligenco, kot je Ego4D, bo skrbi v zvezi z zasebnostjo veliko več.

Pozitivno je, da projekt Ego4D daje zelo jasen vpogled v to kaj želi Facebook doseči z metaverzom, vsaj ko gre za pomoč uporabnikom v njihovem vsakdanjem življenju. In močna uporaba razširjene resničnosti za dosego teh ciljev je znak, da se bo Facebook lotil AR in da so zagotovo v pripravi bolj napredne nosljive naprave. Toda največje vprašanje je, ali bodo uporabniki zadovoljni Facebook imajo bolj oseben dostop do svojih življenj prek prvoosebnih videoposnetkov, glede na skočno preteklost podjetja s škandali, povezanimi z zasebnostjo.

vir: Facebook

FTC je pripravljen ukrepati glede lažnih ocen, opozarja 100 podjetij

O avtorju