Facebook обучава AI в изглед от първо лице. Това е интелигентно и тревожно

click fraud protection

Facebook обяви нов изследователски проект, наречен Ego4D, който има за цел да обучава AI модели с помощта на видеоклипове, заснети от човешката перспектива и след това предоставяне на насоки с помощта на сигнали за разширена реалност чрез достъп до дневника на миналото записи. Най-новият изследователски проект на гиганта на социалните медии, ориентиран към изкуствения интелект, поставя технологията за компютърно зрение отпред и в центъра, която вече се използва от някои степен за продукти като Google Lens и шепа други инструменти за пазаруване, където изображението се изучава, за да изтегли подобни обяви от електронната търговия платформи.

Компанията наскоро разясни подробно работата си по нови Инструменти за визуално търсене и откриване на продукти, задвижвани от AI това ще подобри изживяването при пазаруване в Instagram. Надолу по пътя той ще изведе онлайн списъци с дрехи, като просто докосне снимката на човек. Вътрешната система за разпознаване на продукти е толкова усъвършенствана, че ще извлича подходящи продукти дори за неясни текстови заявки като „намерете риза с подобен модел на точки“ на своите платформи. Но всички тези системи за разпознаване на обекти се основават предимно на система за компютърно зрение, обучена на снимки и видеоклипове, заснети от гледна точка на трето лице.

Facebook прави крачка по-далеч, като променя гледната точка на тренировъчните данни отстрани към направо в средата на действието с гледна точка от първо лице като част от своя Ego4D AI проект. Възможностите изглеждат безкрайно полезни, а също и малко страшни. За да събере данните за обучението, Facebook си партнира с 13 институции в девет държави, които наеха над 700 участници, за да запишат повече над 2200 часа кадри от първо лице, документиращи ежедневни дейности като пазаруване на хранителни стоки, миене на прибори и свирене на барабани, за да назовем малцина. Целта е да се уловят дейностите и също така да се оцени сценария от гледна точка на човек, подобно на действието, записано от Собствените слънчеви очила Ray-Ban Stories на Facebook.

Първият поглед върху метавселената с AR в центъра

Компанията го нарича егоцентрично възприятие, откъдето идва и името Ego4D. Видеоклипът беше транскрибирано и анотирано, за да се опише всичко в кадъра от обект до действие, за да се създаде набор от данни, който изследователите от цял ​​свят могат да използват за разработване на системи за компютърно зрение и катализиране на нова вълна от развитие на AI. Уенди наскоро си партнира с Google Cloud, за да създаде една такава система за компютърно зрение, която ще наблюдава кухнята и предупредете готвача, когато е време да обърнете бургери. Въпреки това проектът Ego4D на Facebook поставя AR завъртане върху онези възможности на AI, които надхвърлят анализа и всъщност влизат в сферата на прогнозирането на действията на потребителите.

За да направи това, Facebook създаде набор от пет критерия, които AI трябва да постигне с егоцентричното възприятие. Първата е епизодичната памет, която работи по същия начин като човешката памет. Например, когато потребителите забравят къде са поставили дистанционното на телевизора, AI ще получи достъп до предишни видеоклипове от първо лице, за да провери къде потребителите са го оставили, и след това ще ги насочи към мястото с помощта на AR знаци донякъде като Apple Maps. Вторият бенчмарк е прогнозирането, което предвижда какво предстои да направи потребителят и предоставя необходимото предупреждение. Така че, ако потребителят вече е добавил черен пипер към своето къри и отново посегне към бутилката с пипер на прах, AI ще разпознае предстоящото действие и незабавно ще предупреди потребителите, че съставката вече е била добави.

ние обявяваме #Ego4D, амбициозен дългосрочен проект, който стартирахме с 13 университета в 9 държави, за да подобрим възприемането от първо лице. Тази работа ще катализира изследвания за изграждане на по-полезни AI асистенти, роботи и други бъдещи иновации. https://t.co/oJSxptBo52pic.twitter.com/PaxP4n53C5

— Facebook AI (@facebookai) 14 октомври 2021 г

По същия начин, на „манипулация с ръце и предмети“ benchmark иска AI да запомни правилна последователност от събития, нещо, което учениците ще намерят за полезно, тъй като AR сигналите ще им покажат стъпките в записано видео за обучение. Четвъртият показател е социалното взаимодействие, докато петият - и най-тревожният - е аудиовизуална диаризация. Това включва запазване на аудио (и евентуално базиран на текст) дневник на това, което човек в изгледа на камерата казва. След това потребителите могат да задават въпроси на AI, като например какво е казал ABC по време на кафе-паузата си в определен ден. Facebook все още не е описал в подробности предпазните мерки за привидно масовите сценарии за нахлуване на поверителността на своя проект. В Историите на Ray-Ban вече бяха обект на проверка поради способността им да преминават в режим на пълен пълзящ режим. И с AI, толкова умен като Ego4D, ще има много повече притеснения, свързани с поверителността.

Положителната страна е, че проектът Ego4D дава много ясна представа за какво Facebook иска да постигне с метавселената, поне когато става въпрос за подпомагане на потребителите в ежедневния им живот. И тежкото приложение на разширената реалност за постигане на тези цели е знак, че Facebook ще се заеме с AR и по-модерните носими устройства определено са в процес на подготовка. Но най-големият въпрос е дали потребителите ще се чувстват комфортно Facebook да имат по-личен достъп до живота си чрез видеоклипове от първо лице, като се има предвид схематичното минало на компанията със скандали, свързани с поверителността.

Източник: Facebook

FTC е готов да предприеме действия срещу фалшиви отзиви, предупреждава 100 компании

За автора