פייסבוק מאמנת בינה מלאכותית בתצוגת גוף ראשון. זה חכם ומדאיג

click fraud protection

פייסבוק הכריזה על פרויקט מחקר חדש בשם Ego4D שמטרתו לאמן מודלים של בינה מלאכותית באמצעות סרטונים שצולמו מ- פרספקטיבה אנושית ולאחר מכן מתן הדרכה באמצעות רמזים של מציאות מוגברת על ידי גישה ליומן העבר הקלטות. פרויקט המחקר האחרון של ענקית המדיה החברתית המתמקדת בינה מלאכותית מעמיד את טכנולוגיית הראייה הממוחשבת בראש ובראשונה, שכבר נמצאת בשימוש אצל חלק היקף עבור מוצרים כגון Google Lens וקומץ כלי קניות אחרים שבהם לומדים תמונה כדי למשוך רישומים דומים ממסחר אלקטרוני פלטפורמות.

לאחרונה פירטה החברה את עבודתה בנושא חדש כלי חיפוש חזותי וגילוי מוצרים המופעלים על ידי בינה מלאכותית שתגביר את חווית הקנייה באינסטגרם. בהמשך הדרך, הוא יביא רשימות מקוונות של פריטי לבוש פשוט על ידי הקשה על תמונה של אדם. מערכת זיהוי המוצרים הפנימית כל כך מתקדמת שהיא תביא מוצרים רלוונטיים אפילו עבור שאילתות מבוססות טקסט מעורפלות כמו "מצא חולצה עם דפוס נקודות דומה" בפלטפורמות שלה. אבל כל מערכות זיהוי האובייקטים הללו מבוססות בעיקר על מערכת ראייה ממוחשבת המאומנת על תמונות וסרטונים שצולמו מנקודת מבט של גוף שלישי.

פייסבוק הולכת צעד קדימה על ידי שינוי הפרספקטיבה של נתוני אימון מהצד לישר לאמצע הפעולה עם פרספקטיבה מגוף ראשון כחלק מה-Ego4D AI שלה.

פּרוֹיֶקט. נראה שהאפשרויות מועילות בלי סוף, וגם קצת מפחידות. כדי לאסוף את נתוני ההדרכה, פייסבוק שיתפה פעולה עם 13 מוסדות בתשע מדינות שגייסו למעלה מ-700 משתתפים כדי להקליט יותר מ-2,200 שעות של צילומים בגוף ראשון המתעדים פעילויות יומיומיות כמו קניות במכולת, כביסה של כלים ונגינה בתופים. מְעַטִים. המטרה היא ללכוד את הפעילויות וגם להעריך את התרחיש מנקודת מבטו של אדם עצמו, בדומה לפעולה שתועדה על ידי משקפי השמש Ray-Ban Stories של פייסבוק.

ההצצה הראשונה של Metaverse עם AR במרכז

החברה קוראת לזה תפיסה אגוצנטרית, ומכאן השם Ego4D. הסרטון תומלל והוסבר כדי לתאר את כל מה שנמצא בפריים מאובייקט ועד לפעולה, על מנת ליצור מערך נתונים שבו יכולים חוקרים ברחבי העולם להשתמש כדי לפתח מערכות ראייה ממוחשבת ולזרז גל חדש של פיתוח בינה מלאכותית. Wendy's שיתפה לאחרונה פעולה עם Google Cloud כדי ליצור מערכת ראייה ממוחשבת כזו שתנטר את המטבח ו להזהיר את הטבח כשמגיע הזמן להפוך המבורגרים. עם זאת, פרויקט Ego4D של פייסבוק נותן סיבוב AR על יכולות הבינה המלאכותית שהולכות הרבה מעבר לניתוח ולמעשה נכנסות לתחום של חיזוי פעולות המשתמשים.

כדי לעשות זאת, פייסבוק העלתה קבוצה של חמישה אמות מידה שתפיסה אגוצנטרית צריכה להשיג בינה מלאכותית. הראשון הוא זיכרון אפיזודי, שפועל בדיוק כמו הזיכרון האנושי. לדוגמה, כאשר משתמשים שוכחים היכן הם הניחו את השלט של הטלוויזיה, הבינה המלאכותית תיגש לסרטוני קוד מגוף ראשון כדי לבדוק היכן המשתמשים השאירו אותו, ולאחר מכן ינחה אותם לעבר המקום באמצעות סימני AR קצת כמו Apple Maps. המדד השני הוא חיזוי, אשר חוזה מה המשתמש עומד לעשות ומספק את ההתראה הדרושה. לכן, אם משתמש כבר הוסיף פלפל לקארי שלו, ושוב מושיט יד לבקבוק אבקת הפלפל, ה בינה מלאכותית תזהה את הפעולה הממשמשת ובאה ותתריע למשתמשים באופן מיידי שהמרכיב כבר היה הוסיף.

אנחנו מכריזים #Ego4D, פרויקט שאפתני לטווח ארוך שהתחלנו בו עם 13 אוניברסיטאות ב-9 מדינות כדי לקדם תפיסה מגוף ראשון. עבודה זו תזרז מחקר לבניית עוזרי AI שימושיים יותר, רובוטים וחידושים עתידיים אחרים. https://t.co/oJSxptBo52pic.twitter.com/PaxP4n53C5

— בינה מלאכותית של פייסבוק (@facebookai) 14 באוקטובר 2021

באופן דומה, ה "מניפולציה של יד ואובייקט" benchmark רוצה שה-AI יזכור רצף נכון של אירועים, משהו שתלמידים ימצאו מועילים שכן רמזים AR יראו להם את השלבים בסרטון הדרכה מוקלט. המדד הרביעי הוא אינטראקציה חברתית, בעוד החמישי - והמדאיג ביותר - כן יומן אודיו ויזואלי. זה כרוך בשמירת יומן שמע (ואולי גם מבוסס טקסט) של מה שאדם במבט של המצלמה אמר. לאחר מכן, המשתמשים יכולים לשאול את הבינה המלאכותית שאלות כמו מה אמר אדם ABC במהלך הפסקת הקפה ביום מסוים. פייסבוק עדיין לא פירטה את אמצעי ההגנה לתרחישי החדירה האדירים לכאורה לפרטיות עבור הפרויקט שלה. ה סיפורי ריי-באן כבר נבדקו בגלל היכולת שלהם לעבור למצב קריפ מלא. ועם AI חכם כמו Ego4D, יהיו הרבה יותר דאגות הקשורות לפרטיות.

בצד החיובי, פרויקט Ego4D נותן הצצה ברורה מאוד של מה פייסבוק רוצה להשיג עם metaverse, לפחות בכל הנוגע לסיוע למשתמשים בחיי היומיום שלהם. והיישום הכבד של מציאות רבודה כדי להשיג את המטרות הללו הוא סימן לכך שפייסבוק תלך כול-אין ב-AR ומכשירים לבישים מתקדמים יותר נמצאים בהחלט בצנרת. אבל השאלה הגדולה ביותר היא אם למשתמשים יהיה נוח פייסבוק בעלי גישה אישית יותר לחייהם באמצעות סרטונים בגוף ראשון, בהתחשב בעברה המצומצם של החברה עם שערוריות הקשורות לפרטיות.

מָקוֹר: פייסבוק

FTC מוכן לפעול על סקירות מזויפות, מזהיר 100 חברות

על הסופר