פריצת דרך חדשה בלמידת מכונה משפרת את זיהוי התנוחה של אובייקטים

Image by Pixabay

This post is also available in: English (אנגלית)

חוקרים הציגו לאחרונה גישה חדשה ללמידה מונחית באופן עצמי (Self-Supervised Learning – SSL ) שמשפרת באופן משמעותי את היכולת של המכונה לזהות אובייקטים ולהבין את הכיוון בו הם נמצאים בחלל. מחקר זה, שהוצג בכנס האירופי של ראיית מחשב במילאנו, עוסק באתגר נפוץ במערכות אוטונומיות, כגון מכוניות אוטונומיות ורובוטיקה, שבו הבנת הזהות והמיקום של אובייקט במרחב היא קריטית לבטיחות ויעילות.

SSL היא טכניקת למידת מכונה שמכשירה מודלים על נתונים ללא מתוייגים, ומאפשרת למערכות לעשות הכללות טובות יותר בסביבות בעולם האמיתי. בעוד ששיטה זו מצוינת בזיהוי אובייקטים, היא באופן מסורתי מתקשה יותר כאשר אובייקטים נצפים מזוויות או תנוחות שונות. מגבלה זו עלולה להיות בעייתית עבור יישומים שונים המחייבים שהמכונה תבין את זווית האובייקט שלפניה כדי להחליט על פעולת המשך (כמו רכב אוטונומי שצריך להחליט אם זווית הרכב שלפניו עלולה להוביל לתאונה חזיתית).

על פי המדווח ב-TechXplore, כדי להתגבר על אתגר זה, צוות המחקר פיתח אמת מידה חדשה עבור מודלים אימון על זיהוי מודע-תנוחה. הגישה משתמשת במערך נתונים של שלישיות תמונה ללא תווית, שכל אחת מהן מורכבת משלוש תמונות רצופות של אותו אובייקט שמצולם מזוויות שונות במקצת. המערכת הזו דומה להתנהגותם של רובוטים כשהם נעים בסביבה ומתבוננים באותו אובייקט מנקודות מבט שונות ללא ידע מוקדם על זהותו או תנוחתו.

הצוות השתמש בטכניקה חדשה של יצירת רגולציה של המרחב בשכבה האמצעית של הרשת העצבית, אשר ממפה את שלוש התצוגות של אותו אובייקט על קו ישר. שיטה זו לא רק משפרת את הדיוק של הערכת התנוחה ב-10-20%, אלא גם משפרת את יכולתו של המודל לזהות אובייקטים במקומות חדשים שלא ראה בעבר מבלי לפגוע ביכולות זיהוי האובייקטים שלו.

הטכניקה החדשה בעלת השלכות מבטיחות על כלי רכב אוטונומיים, רובוטיקה ומערכות בינה מלאכותית אחרות, בכך שהיא מאפשרת הבנה מדויקת וחזקה יותר של שני האובייקטים והקשרים המרחביים שלהם. יתר על כן, לגישה יש יישומים פוטנציאליים מעבר להכרה חזותית, כגון בניתוח נתוני אודיו, שבו הבנה של שינויים מתמשכים לאורך זמן היא חיונית.