This post is also available in:
English (אנגלית)
מסגרת חדשה שפותחה על ידי חוקרים ב-MIT וב-NVIDIA קובעת סטנדרט חדש לתיקון התנהגות רובוטית, מה שמקל על המשתמשים להנחות רובוטים סביב משימות באמצעות אינטראקציות פשוטות ואינטואיטיביות. בניגוד למערכות קיימות, המחייבות את המשתמשים לאסוף נתונים חדשים או לאמן מחדש מודלים של למידת מכונה, גישה חדשנית זו מאפשרת למשתמשים לתקן התנהגות רובוטית בזמן אמת ללא צורך במומחיות טכנית.
הליבה של המסגרת טמונה ביכולתה לעבד משוב אנושי טבעי בזמן אמת. יכולת זו מאפשרת לרובוטים לבחור את רצף הפעולות היעיל ביותר, אשר תואם את מטרות המשתמש. בבדיקות, המערכת עלתה על השיטות הקיימות שלא כללו קלט אנושי ב-21%. לדברי החוקרים, התקדמות זו היא קריטית, שכן היא מבטלת את הצורך של הצרכנים לבצע איסוף נתונים או לכוונן רשתות עצביות מורכבות, תוך התמודדות עם אתגר מפתח בהפיכת הרובוטיקה לידידותית יותר למשתמש.
באופן מסורתי, רובוטים מאומנים להשלים משימות ספציפיות. עם זאת, ייתכן שמשימות אלה לא יפעלו תמיד כמתוכנן, בשל הבדלים בתרחישים בעולם האמיתי, כגון אוריינטציה שונה של אובייקטים. תיקון בעיות אלה דורש בדרך כלל תכנות מחדש של הרובוט, תהליך הגוזל זמן ודורש משאבים יקרים. עם זאת, מסגרת חדשה זו מאפשרת למשתמשים לבצע תיקונים מיידיים ללא צורך לאמן מחדש את המודל של הרובוט.
המסגרת מציעה שלוש שיטות אינטואיטיביות לאינטראקציה עם המשתמש: בחירת אובייקטים בממשק המצלמה, שרטוט המסלולים הרצויים, או הנחיה פיזית של זרוע הרובוט. גישות אלה מבטיחות שרובוטים יפעלו בהתאם לכוונת המשתמש תוך שמירה על בטיחות על ידי מניעת פעולות שעלולות להוביל לשגיאות כמו התנגשויות.
תכונה מרכזית נוספת של המסגרת היא יכולת הלמידה ההסתגלותית שלה. תיקונים חוזרים ונשנים של משתמשים מסייעים לרובוט לשפר את התנהגותו לאורך זמן, תוך שיפור פעולותיו על סמך ההתאמות שבוצעו במהלך אינטראקציות בזמן אמת. תהליך למידה מתמשך זה מקטין את הצורך בתיקונים נוספים ומגביר את יעילות הרובוט.
הצוות שעומד מאחורי הפרויקט פועל כעת כדי לייעל את תהליך הדגימה ולהרחיב את יכולת המערכת ליצור מדיניות רובוטית בסביבות חדשות. פריצת דרך זו מסמנת צעד חשוב לקראת הפיכת רובוטים לסתגלנים יותר ורספונסיבים לקלט אנושי במגוון תרחישים.
ניתן למצוא את המחקר של הצוות ב-arXiv.