This post is also available in: 
     English (אנגלית)
English (אנגלית)
חוקרים ממעבדת לימוד הרובוטים של סטיבן ג'יימס בלונדון פיתחו מערכת פורצת דרך בשם Genima, המשתמשת בתמונות שנוצרו על ידי בינה מלאכותית כדי להכשיר מכונות רובוטיות. על ידי כוונון עדין של Stable Diffusion, ג'נימה מאפשרת הדמיה של תנועות רובוטים, ומנחה אותם הן בסימולציות והן בעולם האמיתי.
ג'נימה מתפקדת כסוכן שכפול התנהגות, בשונה מהגישה המסורתית לאימון רובוטים. היא "מציירת תנועות מפרקים" על גבי תמונות RGB, אשר מעובדות לאחר מכן על ידי בקר שממפה מטרות חזותיות אלה לכדי רצף של פוזיציות מפרקים שונות. שיטה חדשנית זו מאפשרת לשלל סוגים של רובוטים, החל מזרועות מכניות וכלה ברובוטים דמויי אדם ומכוניות אוטונומיות, ללמוד משימות מורכבות ביתר יעילות.
על פי Interesting Engineering, החוקרים ערכו מחקרים נרחבים תוך שימוש בג'נימה על פני 25 משימות מתוך סימולציית RLBench ו-9 תרחישי מניפולציה בעולם האמיתי. הם גילו כי על ידי המרת פעולות לתוך מרחב התמונה, מודלי diffusion מאומנים מראש באינטרנט יכלו לייצר מדיניות שמתעלה על גישות חזותיות חדשניות. יש לציין כי ג'מינה הפגינה רובוסטיות למול הפרעות בסצנה והתאמה לאובייקטים חדשים, מה שהפך אותה לתחרותית גם למול סוכני תלת-מימד המשתמשים בנתונים נוספים כגון עומק ונקודות מפתח.
עם זאת, המחקר מציין שלג'נימה יש מגבלות משלה. כמו כל סוכני שיבוט ההתנהגות, היא מתמקדת בזיקוק התנהגויות של מומחים במקום לגלות התנהגויות חדשות. המערכת מסתמכת על כיול המצלמה כדי לעבד במדויק מטרות, בהנחה שהרובוט תמיד גלוי מנקודת מבט מסוימת.
החוקרים אימתו את יעילותה של ג'נימה על ידי השוואת הביצועים שלה נגד פעילות רשת עצבית על מערכות רובוט אמיתיות. באמצעות רובוט Franka Emika Panda המצויד במצלמות חיצוניות ומצלמות על המפרקים שלו, הם הכשירו סוכנים רב-משימתיים מאפס בתשע משימות שונות, כולל טיפול בחפצים דינמיים וניתנים לשינוי. המערכת מדמיינת את הפעולות הרצויות – כגון פתיחת תיבה או תליית צעיף – דרך כדורים צבעוניים הממוקמים על גבי תמונות, המציינים תנועות משותפות עתידיות.
בניסויים, ג'נימה השלימה 25 סימולציות ותשע משימות בעולם האמיתי, והשיגה שיעורי הצלחה ממוצעים של 50% ו -64%, בהתאמה, על פי MIT Technology Review. הפוטנציאל של מודלי diffusion מאומנים מראש בטרנספורמציה של רובוטיקה מקביל להשפעה המהפכנית שלהם על יצירת תמונה, מה שמאותת על עתיד מבטיח לטכניקות אימון רובוטיות.

 
            
