Facebook harjoittelee tekoälyä ensimmäisen persoonan näkymässä. Se on älykäs ja hälyttävä

click fraud protection

Facebook on julkistanut uuden tutkimusprojektin nimeltä Ego4D, jonka tavoitteena on kouluttaa tekoälymalleja käyttämällä videoita, jotka on kuvattu a inhimillinen näkökulma ja antaa sitten ohjausta käyttämällä lisätyn todellisuuden vihjeitä käyttämällä menneisyyden lokia tallenteita. Sosiaalisen median jättiläisen uusin tekoälykeskeinen tutkimusprojekti asettaa etusijalle tietokonenäköteknologian, joka on jo käytössä. laajuus tuotteille, kuten Google Lens ja kourallinen muita ostostyökaluja, joissa kuvaa tutkitaan saadakseen samanlaisia ​​ilmoituksia verkkokaupasta alustat.

Yhtiö esitteli äskettäin työtään uusien parissa Tekoälypohjaiset visuaaliset haku- ja tuoteetsintätyökalut mikä parantaa ostokokemusta Instagramissa. Matkan varrella se hakee vaatteiden online-luetteloita yksinkertaisesti napauttamalla henkilön valokuvaa. Yrityksen sisäinen tuotteiden tunnistusjärjestelmä on niin edistynyt, että se poimii oleellisia tuotteita myös epämääräisiin tekstipohjaisiin kyselyihin, kuten "etsi paita, jolla on samanlainen pilkkukuvio" alustoillaan. Mutta kaikki nämä kohteen tunnistusjärjestelmät perustuvat pääasiassa tietokonenäköjärjestelmään, joka on koulutettu kolmannen persoonan näkökulmasta otettuihin valokuviin ja videoihin.

Facebook menee askeleen pidemmälle muuttamalla harjoitustietojen näkökulmaa sivurajasta suoraan toiminnan keskelle ensimmäisen persoonan näkökulmasta osana Ego4D AI: tä. hanke. Mahdollisuudet näyttävät olevan loputtomasti hyödyllisiä ja myös hieman pelottavia. Koulutustietojen keräämiseksi Facebook teki yhteistyötä 13 laitoksen kanssa yhdeksästä maasta, jotka rekrytoivat yli 700 osallistujaa tallentaakseen lisää. yli 2 200 tuntia ensimmäisen persoonan materiaalia, joka dokumentoi päivittäisiä toimintoja, kuten ruokaostoksia, pesuvälineitä ja rumpujen soittamista. muutama. Tavoitteena on vangita toimintaa ja myös arvioida skenaariota ihmisen omasta näkökulmasta, aivan kuten tallentaman toiminnan Facebookin omat Ray-Ban Stories -aurinkolasit.

Ensimmäinen välähdys Metaversesta, jossa AR on keskellä

Yhtiö kutsuu sitä itsekeskeiseksi havainnoksi, mistä johtuu nimi Ego4D. Video transkriboitiin ja siihen tehtiin huomautukset kuvaamaan kaikkea kehyksessä olevaa objektista toimintaan, jotta voidaan luoda tietojoukko, jota tutkijat ympäri maailmaa voivat käyttää tietokonenäköjärjestelmien kehittämiseen ja tekoälyn uuden kehityksen aallon katalysoimiseen. Wendy's teki äskettäin yhteistyötä Google Cloudin kanssa luodakseen yhden sellaisen tietokonenäköjärjestelmän, joka valvoo keittiötä ja varoittaa kokkia, kun on aika kääntää hampurilaiset. Facebookin Ego4D-projekti tuo kuitenkin AR-pyöräytteen niille tekoälyominaisuuksille, jotka menevät paljon analyysiä pidemmälle ja astuvat itse asiassa käyttäjien toiminnan ennustamiseen.

Tätä varten Facebook on loihtinut viisi vertailukohtaa, jotka itsekeskeisen tekoälyn on saavutettava. Ensimmäinen on episodinen muisti, joka toimii aivan samalla tavalla kuin ihmisen muisti. Esimerkiksi, kun käyttäjät unohtavat, mihin he asettivat television kaukosäätimen, tekoäly käyttää ensimmäisen persoonan videoita tarkistaakseen, mihin käyttäjät sen jättivät, ja ohjaa heidät sitten kohti paikkaa AR-vihjeillä. vähän kuin Apple Maps. Toinen vertailukohta on ennustaminen, joka ennustaa, mitä käyttäjä aikoo tehdä ja antaa tarvittavan hälytyksen. Joten jos käyttäjä on jo lisännyt pippuria curryonsa ja kurottaa jälleen kätensä pippurijauhepulloon, Tekoäly tunnistaa lähestyvän toiminnan ja ilmoittaa käyttäjille välittömästi, että ainesosa on jo ollut lisätty.

Me ilmoitamme #Ego4D, kunnianhimoinen pitkän aikavälin hanke, jonka olemme käynnistäneet 13 yliopiston kanssa 9 maassa edistääksemme ensimmäisen persoonan havaintoa. Tämä työ katalysoi tutkimusta hyödyllisten tekoälyassistenttien, robottien ja muiden tulevaisuuden innovaatioiden rakentamiseksi. https://t.co/oJSxptBo52pic.twitter.com/PaxP4n53C5

- Facebook AI (@facebookai) 14. lokakuuta 2021

Samoin, "käsin ja esineen manipulointi" benchmark haluaa tekoälyn muistavan oikean tapahtumasarjan, josta oppilaat pitävät apua, koska AR-vihjeet näyttävät heille vaiheet tallennetussa harjoitusvideossa. Neljäs vertailukohta on sosiaalinen vuorovaikutus, kun taas viides – ja huolestuttavin – on audiovisuaalinen päiväkirja. Tämä sisältää äänilokin (ja mahdollisesti myös tekstipohjaisen) tallentamisen siitä, mitä kameran näkymässä oleva henkilö sanoi. Käyttäjät voivat sitten kysyä tekoälyltä kysymyksiä, kuten mitä henkilö ABC sanoi kahvitauolla tiettynä päivänä. Facebook ei ole vielä täsmentänyt suojatoimenpiteitä projektinsa näennäisen massiivisten yksityisyyden loukkausskenaarioiden varalta. The Ray-Ban Stories on jo tullut tarkastelun kohteeksi koska ne pystyvät siirtymään täyden ryömintätilaan. Ja Ego4D: n kaltaisen älykkään tekoälyn avulla on paljon enemmän yksityisyyteen liittyviä huolia.

Positiivinen puoli on se, että Ego4D-projekti antaa erittäin selkeän kuvan siitä mitä Facebook haluaa saavuttaa metaversumilla, ainakin kun on kyse käyttäjien auttamisesta heidän jokapäiväisessä elämässään. Ja lisätyn todellisuuden raskas soveltaminen näiden tavoitteiden saavuttamiseen on merkki siitä, että Facebook on menossa all-in AR: lle ja kehittyneempiä puettavia laitteita on ehdottomasti valmisteilla. Mutta suurin kysymys on, ovatko käyttäjät mukavia Facebook heillä on henkilökohtaisempi pääsy elämäänsä ensimmäisen persoonan videoiden kautta, kun otetaan huomioon yrityksen summittainen menneisyys yksityisyyteen liittyvien skandaalien kanssa.

Lähde: Facebook

FTC on valmis ryhtymään toimiin väärennettyjen arvostelujen vuoksi, varoittaa satoja yrityksiä

Kirjailijasta