Facebook กำลังฝึก AI ในมุมมองบุคคลที่หนึ่ง มันฉลาดและน่าตกใจ

click fraud protection

เฟสบุ๊ค ได้ประกาศโครงการวิจัยใหม่ที่เรียกว่า Ego4D ซึ่งมีเป้าหมายเพื่อฝึกโมเดล AI โดยใช้วิดีโอที่ถ่ายจาก มุมมองของมนุษย์แล้วให้คำแนะนำโดยใช้ตัวชี้นำความเป็นจริงยิ่งโดยการเข้าถึงบันทึกของอดีต การบันทึก โครงการวิจัย AI-centric ล่าสุดของยักษ์ใหญ่ด้านโซเชียลมีเดียทำให้เทคโนโลยีการมองเห็นด้วยคอมพิวเตอร์อยู่ด้านหน้าและตรงกลางซึ่งใช้กับบางคนแล้ว ขอบเขตสำหรับผลิตภัณฑ์เช่น Google Lens และเครื่องมือช้อปปิ้งอื่น ๆ จำนวนหนึ่งที่มีการศึกษาภาพเพื่อดึงรายชื่อที่คล้ายกันจากอีคอมเมิร์ซ แพลตฟอร์ม

บริษัทเพิ่งให้รายละเอียดเกี่ยวกับงานใหม่ เครื่องมือค้นหาและค้นหาผลิตภัณฑ์ด้วยภาพที่ขับเคลื่อนด้วย AI ที่จะช่วยเพิ่มประสบการณ์การช็อปปิ้งบน Instagram ระหว่างทาง มันจะดึงรายการเสื้อผ้าออนไลน์ขึ้นมาโดยเพียงแค่แตะที่รูปของบุคคล ระบบการจดจำผลิตภัณฑ์ภายในองค์กรนั้นล้ำหน้ามากจนสามารถดึงผลิตภัณฑ์ที่เกี่ยวข้องขึ้นมาได้แม้สำหรับข้อความค้นหาที่ใช้ข้อความที่คลุมเครือ เช่น "ค้นหาเสื้อเชิ้ตที่มีลวดลายลายจุดคล้าย ๆ กัน" บนแพลตฟอร์ม แต่ระบบการรู้จำวัตถุเหล่านี้ส่วนใหญ่ใช้ระบบการมองเห็นด้วยคอมพิวเตอร์ซึ่งฝึกฝนเกี่ยวกับภาพถ่ายและวิดีโอที่ถ่ายจากมุมมองของบุคคลที่สาม

Facebook ก้าวไปอีกขั้นด้วยการเปลี่ยนมุมมองของข้อมูลการฝึกจากข้างสนามเป็นตรงกลางของการกระทำด้วยมุมมองบุคคลที่หนึ่งซึ่งเป็นส่วนหนึ่งของ Ego4D AI โครงการ. ความเป็นไปได้ดูเหมือนจะเป็นประโยชน์อย่างไม่รู้จบและน่ากลัวเล็กน้อยเช่นกัน เพื่อรวบรวมข้อมูลการฝึกอบรม Facebook ร่วมมือกับ 13 สถาบันในเก้าประเทศที่คัดเลือกผู้เข้าร่วมกว่า 700 คนเพื่อบันทึกเพิ่มเติม ฟุตเทจมุมมองบุคคลที่หนึ่งมากกว่า 2,200 ชั่วโมง ซึ่งบันทึกกิจกรรมในแต่ละวัน เช่น การซื้อของชำ การล้างภาชนะ และการเล่นกลอง น้อย. เป้าหมายคือการจับภาพกิจกรรมและประเมินสถานการณ์จากมุมมองของบุคคลเช่นเดียวกับการกระทำที่บันทึกโดย แว่นกันแดด Ray-Ban Stories ของ Facebook.

เหลือบแรกของ Metaverse กับ AR ที่ศูนย์

บริษัทเรียกมันว่าการรับรู้ที่มีอัตตาเป็นศูนย์กลาง ดังนั้นชื่อ Ego4D วิดีโอถูกถอดเสียงและใส่คำอธิบายประกอบเพื่ออธิบายทุกอย่างในเฟรมตั้งแต่วัตถุไปจนถึงการกระทำ เพื่อสร้าง ชุดข้อมูลที่นักวิจัยทั่วโลกสามารถใช้เพื่อพัฒนาระบบคอมพิวเตอร์วิทัศน์และกระตุ้นคลื่นลูกใหม่แห่งการพัฒนา AI เมื่อเร็วๆ นี้ Wendy ได้ร่วมมือกับ Google Cloud เพื่อสร้างระบบคอมพิวเตอร์วิทัศน์ที่จะคอยตรวจสอบห้องครัวและ เตือนพ่อครัวเมื่อถึงเวลาพลิกเบอร์เกอร์. อย่างไรก็ตาม โปรเจ็กต์ Ego4D ของ Facebook ได้นำ AR มาใช้กับความสามารถ AI เหล่านั้น ที่นอกเหนือไปจากการวิเคราะห์และก้าวเข้าสู่ขอบเขตของการคาดการณ์การกระทำของผู้ใช้จริงๆ

ในการทำเช่นนั้น Facebook ได้สร้างชุดเกณฑ์มาตรฐานห้าประการที่ AI การรับรู้ที่มีอัตตาเป็นศูนย์กลาง อย่างแรกคือความจำแบบเป็นตอน ซึ่งทำงานในลักษณะเดียวกับความจำของมนุษย์ ตัวอย่างเช่น เมื่อผู้ใช้ลืมว่าวางรีโมททีวีไว้ที่ไหน AI จะเข้าถึงวิดีโอมุมมองบุคคลที่หนึ่งที่ผ่านมาเพื่อตรวจสอบว่าผู้ใช้ทิ้งไว้ที่ใด จากนั้นจะนำทางพวกเขาไปยังสถานที่โดยใช้ตัวชี้นำ AR คล้ายกับ Apple Maps. เกณฑ์มาตรฐานที่สองคือการคาดการณ์ ซึ่งคาดการณ์ว่าผู้ใช้กำลังจะทำอะไรและให้การแจ้งเตือนที่จำเป็น ดังนั้น หากผู้ใช้ใส่พริกไทยลงในแกงแล้ว และเอื้อมมือไปหยิบขวดผงพริกไทยอีกครั้ง AI จะรับรู้ถึงการกระทำที่จะเกิดขึ้นและจะแจ้งเตือนผู้ใช้ทันทีว่าส่วนผสมได้รับแล้ว เพิ่ม

เรากำลังประกาศ #อีโก้4ดีซึ่งเป็นโครงการระยะยาวที่มีความทะเยอทะยานที่เราได้ดำเนินการกับมหาวิทยาลัย 13 แห่งใน 9 ประเทศเพื่อพัฒนาการรับรู้ของบุคคลที่หนึ่ง งานนี้จะกระตุ้นการวิจัยเพื่อสร้างผู้ช่วย AI หุ่นยนต์ และนวัตกรรมอื่นๆ ในอนาคตที่เป็นประโยชน์มากขึ้น https://t.co/oJSxptBo52pic.twitter.com/PaxP4n53C5

— Facebook AI (@facebookai) 14 ตุลาคม 2564

ในทำนองเดียวกัน 'การจัดการมือและวัตถุ' เกณฑ์มาตรฐานต้องการให้ AI จดจำลำดับเหตุการณ์ที่ถูกต้อง ซึ่งนักเรียนจะพบว่ามีประโยชน์ เนื่องจากตัวชี้นำ AR จะแสดงขั้นตอนในวิดีโอการฝึกอบรมที่บันทึกไว้ เกณฑ์มาตรฐานที่สี่คือปฏิสัมพันธ์ทางสังคม ในขณะที่ข้อที่ห้า — และที่น่าตกใจที่สุด — is การแยกภาพและเสียง. สิ่งนี้เกี่ยวข้องกับการบันทึกเสียง (และอาจเป็นแบบข้อความด้วย) บันทึกสิ่งที่บุคคลในมุมมองของกล้องพูด ผู้ใช้สามารถถามคำถามเกี่ยวกับ AI ได้ เช่น สิ่งที่ ABC พูดระหว่างช่วงพักดื่มกาแฟในวันใดวันหนึ่ง Facebook ยังไม่ได้ให้รายละเอียดเกี่ยวกับการป้องกันสถานการณ์การบุกรุกความเป็นส่วนตัวที่ดูเหมือนมีขนาดใหญ่สำหรับโครงการนี้ NS Ray-Ban Stories อยู่ภายใต้การตรวจสอบแล้ว เพราะความสามารถในการเข้าโหมดครีปแบบเต็มๆ และด้วย AI ที่ชาญฉลาดอย่าง Ego4D จะมีความกังวลเกี่ยวกับความเป็นส่วนตัวมากขึ้น

ในด้านบวก โครงการ Ego4D ให้ภาพรวมที่ชัดเจนของ สิ่งที่ Facebook ต้องการบรรลุด้วย metaverseอย่างน้อยก็ในการช่วยเหลือผู้ใช้ในชีวิตประจำวัน และการประยุกต์ใช้เทคโนโลยีความจริงเสริมจำนวนมากเพื่อบรรลุเป้าหมายเหล่านี้เป็นสัญญาณว่า Facebook จะใช้งาน AR แบบครบวงจรและอุปกรณ์สวมใส่ขั้นสูงอื่น ๆ อยู่ในขั้นตอนการดำเนินการอย่างแน่นอน แต่คำถามที่ใหญ่ที่สุดคือผู้ใช้จะสบายใจหรือไม่ เฟสบุ๊ค เข้าถึงชีวิตส่วนตัวได้มากขึ้นผ่านวิดีโอมุมมองบุคคลที่หนึ่ง เมื่อพิจารณาจากอดีตที่คร่าวๆ ของบริษัทเกี่ยวกับเรื่องอื้อฉาวเกี่ยวกับความเป็นส่วนตัว

แหล่งที่มา: เฟสบุ๊ค

FTC พร้อมที่จะดำเนินการกับรีวิวปลอม เตือนบริษัทกว่า 100 แห่ง

เกี่ยวกับผู้เขียน