מסגרת בינה מלאכותית חדשה מלמדת רובוטים להשתמש בכלים באמצעות צפייה בסרטונים

Aug 28, 2025

Image by Unsplash — Representational image

This post is also available in: English (אנגלית)

צוות מחקר מאוניברסיטת אילינוי באורבנה-שמפיין, בשיתוף פעולה עם אוניברסיטת קולומביה ואוניברסיטת טקסס באוסטין, הציג מערכת חדשה המאפשרת לרובוטים ללמוד כישורי שימוש מורכבים בכלים פשוט באמצעות צפייה בקטעי וידאו. הגישה, שנקראת "Tool-as-Interface" (כלי כממשק), מהווה פריצת דרך לעומת שיטות מסורתיות בתחום הרובוטיקה, אשר לרוב נשענות על תכנות ידני או מערכות חישה מתקדמות ויקרות.

המערכת מאפשרת לרובוטים לצפות בביצוע משימות — כמו נעיצת מסמרים, הגשת אוכל או הפיכת מזון במחבת — ולשחזר אותן תוך שימוש אך ורק בקלט חזותי משתי זוויות מצלמה. השיטה אינה דורשת חליפות לכידת תנועה, כלים מיוחדים או שליטה אנושית מרחוק.

לפי TechXplore, בלב המערכת עומד מודל חזותי בשם MASt3R, אשר ממיר שני פריימים מתוך סרטון רגיל לשחזור תלת־ממדי של הסצנה. באמצעות טכניקה בשם 3D Gaussian Splatting, המערכת יוצרת נקודות מבט סינתטיות נוספות, המאפשרות לרובוט לנתח את המשימה מזוויות שונות.

כדי להתמקד באינטראקציה שבין הכלי לסביבתו, הדמות האנושית נמחקת מהתמונה באמצעות מודל סגמנטציה בשם Grounded-SAM. נקודת המבט המרוכזת בכלי בלבד מאפשרת למערכת להבין את תפקודו ותנועתו, במקום פשוט לחקות את הפעולות האנושיות. כתוצאה מכך, ניתן להעביר את הכישורים הנלמדים בקלות רבה יותר לפלטפורמות רובוטיות שונות, גם אם יש להן מבנה חומרה שונה.

החוקרים בחנו את השיטה בחמש משימות שונות, כולל נעיצת מסמרים, הגשת כדורי בשר ובעיטת כדור. הרובוטים ביצעו את הפעולות בהצלחה גבוהה, תוך שיפור של 71% ביחס לאימון מסורתי המשתמש בטלאופרציה, וקיצור זמן האימון ב-77%.

עם זאת, המערכת עדיין אינה חפה ממגבלות. בשלב זה, היא מניחה שהכלים מקובעים לזרוע הרובוטית, ולעיתים טועה בהערכות מיקום בעת שחזור זוויות מצלמה. אף על פי כן, הצוות רואה בכך צעד משמעותי לקראת האפשרות ללמד רובוטים משימות חדשות באמצעות תוכן וידאו זמין ברשת, כגון מדריכים מקוונים או סרטונים ביתיים.

המחקר זכה בפרס המאמר המצטיין בכנס ICRA 2025 וזמין לקריאה מוקדמת באתר arXiv.

מסגרת בינה מלאכותית חדשה מלמדת רובוטים להשתמש בכלים באמצעות צפייה בסרטונים

כתבות אחרונות

שידור רציף, גם על כנף מטוס: אנטנות גמישות בהדפסה תלת־ממדית

קפיצה בזיהוי חזותי: בינה מלאכותית לומדת להבחין בפריטים אישיים

העתיד של השיקום הוויזואלי בעזרת בינה מלאכותית

פיתוח חדש מבטיח סוללות בטוחות יותר, עמידות וידידותיות לסביבה

עם דיוק של 99%: כך חברת Never Mine מעצבת מחדש את...

שיטה חדשה לייצור מגנטים תחזק את מנועי האנרגיה הנקייה

היכונו לעתיד: לא צריך 1.21 ג'יגו-וואט, רק תשתית טובה

מערכת רובוטית דקיקה מציעה טיפול ממוקד בגוף

צריח חדש עם הגנה חכמה לרחפנים ומטוסים נמוכים

מעקב אחר יתושים ושיטפונות מהחלל

כמו פרחים בטבע: רובוטי דנ"א זעירים שמשנים את חוקי המשחק הרפואי

מנוע זעיר מדגים חום קיצוני לחקר תרמודינמיקה ומחלות

חוקרים הצליחו להגיע לדיוק במיקום ברמת הסנטימטרים בשעונים חכמים

רופא בכיס החלל: עוזרים דיגיטליים לשמירת בריאות במרחק מיליוני ק"מ

טכנולוגיית אבטחה שאי אפשר לשכפל – בתוך טיפה של ג'ל

מצמצמים את פער הטאלנטים העולמי עם בינה מלאכותית: כך חברת אייברס...

כלי קוד פתוח חדש משנה את חוקי המשחק בהדפסה מרובת־חומרים

חכם בשמש – החיישן השקוף שיזהיר אותך לפני שתישרף

אטלס: הדפדפן מבוסס בינה מלאכותית שמנסה לשנות את חוויית החיפוש באינטרנט

טכנולוגיה פורצת דרך לטיפול לא פולשני בפציעות פנימיות