This post is also available in:
ככל שרובוטים הומנואידיים הופכים מתקדמים יותר, אחד האתגרים המרכזיים הוא להפוך את האינטראקציה איתם לטבעית יותר. זיהוי פנים מדויק, מעקב אחר הבעות ושחזור רמזים רגשיים עדינים — כולם תלויים במיפוי מדויק של תווי הפנים. אולם רוב המערכות הקיימות נשענות על תמונות דו־ממדיות או מודלים סינתטיים, מה שעלול ליצור שגיאות בשל פערים בין מרקם חזותי לבין הגאומטריה האמיתית.
גישה חדשה מבקשת לעקוף מגבלות אלו באמצעות עבודה ישירה עם נתונים תלת־ממדיים. חוקרים בסין פיתחו מאגר נתונים רחב הכולל כ־200 אלף סריקות פנים תלת־ממדיות ברזולוציה גבוהה, לצד מודל בינה מלאכותית המיועד לזהות נקודות ציון בפנים (facial landmarks) באמצעות מידע גאומטרי גולמי, ללא הסתמכות על טקסטורה חזותית.
המערכת מבוססת על "ענני נקודות" (Point Clouds), כלומר אוספים של קואורדינטות מרחביות המתארות את צורת הפנים מבלי להסתמך על מראה חיצוני. כדי לעבד נתונים אלו פיתח הצוות רשת גרפים עם מנגנון קשב משולב עקמומיות (Curvature-Fused Graph Attention Network – CF-GAT), המנתחת הן פרטים מקומיים על פני השטח והן את המבנה הכולל של הפנים.
על פי דיווח של Interesting Engineering, במקום להשתמש בתבניות מוכנות מראש, המודל מחלץ מאפיינים גאומטריים מרכזיים באמצעות התמקדות בעקמומיות, שהם שינויים עדינים בצורה המגדירים את תווי הפנים. שיטת דגימה ייעודית מצמצמת את כמות הנתונים תוך שמירה על מאפיינים קריטיים, וכך מאפשרת פעולה יעילה מבלי לפגוע בדיוק.
באמצעות שילוב מידע על עקמומיות בתוך מנגנון הקשב, המודל מסוגל לזהות נקודות ציון ישירות במרחב התלת־ממדי. הדבר מאפשר לוקליזציה מדויקת יותר של מאפיינים כמו עיניים, אף ופה — גם במקרים שבהם שיטות מבוססות תמונה מתקשות. בבדיקות נמצא כי המערכת עמידה יותר לרעש ומציגה ביצועים טובים יותר על פני מגוון רחב של מבני פנים.
מאגר הנתונים עצמו כולל לא רק סריקות סטטיות, אלא גם הבעות פנים דינמיות בתלת־ממד (4D) ונתונים ביומטריים נלווים, המספקים בסיס רחב לאימון ולהערכה.
מבחינת ביטחון, יכולות כאלה עשויות לשפר מערכות זיהוי ביומטרי, ניתוח וידאו ואינטראקציה בין אדם למכונה. מיפוי פנים תלת־ממדי מדויק יותר עשוי לתמוך באימות זהות בסביבות מורכבות ולשפר את התקשורת בין מפעילים לפלטפורמות רובוטיות.
ככל שרובוטיקה ובינה מלאכותית מתלכדות, היכולת לפרש ולשחזר התנהגות פנים אנושית באמצעות גאומטריה אמיתית עשויה להפוך למרכיב מרכזי בהפיכת מערכות לאפקטיביות יותר — הן ביישומים אזרחיים והן בסביבות מבצעיות.
המחקר פורסם כאן.


























