המשימה: ללמד רובוטים לנוע בשדה הקרב

המשימה: ללמד רובוטים לנוע בשדה הקרב

An iRobot 310 Small Unmanned Ground Vehicle belonging to Combat Logistic Battalion 31, 31st Marine Expeditionary Unit, sits staged with 3-D printed lens covers aboard the USS Wasp (LHD-1) while underway in the Pacific Ocean, April 17, 2018. Marines with CLB-31 are now capable of ‘additive manufacturing,’ also known as 3-D printing, which is the technique of replicating digital 3-D models as tangible objects. The 31st Marine Expeditionary Unit partners with the Navy’s Amphibious Squadron 11 to form the Wasp Amphibious Ready Group, a cohesive blue-green team capable of accomplishing a variety of missions across the Indo-Pacific. (U.S. Marine Corps photo by Cpl. Stormy Mendez/Released)

This post is also available in: enEnglish (אנגלית)

האתגרים איתם מתמודדים רובוטים צבאיים אינם פשוטים. בניגוד למכוניות ללא נהג שמפתחות גוגל, אובר וחברות אחרות, הרובוטים הצבאיים אמורים לפעול בסביבות מורכבות שאין בהן סימונים סטנדרטיים כמו מסלולים, שילוט רחוב, רמזורים ועוד.

כעת, הרובוטים לומדים איך לבצע טוב יותר את המשימות לטובת החיילים, החל ממציאת דרכם בעצמם בהתערבות אנושית מינימלית. הפרויקט מתבצע על ידי חוקרים ממעבדת המחקר של צבא ארה"ב (ARL) ומכון הרובוטיקה באוניברסיטת קרנגי מלון.

לדברי החוקרת מגי וויגנס מה-ARL, "הסביבות בהן אנו פועלים הן לא-מובנות בהשוואה לאלה של המכוניות ללא נהג. אנחנו לא יכולים להניח שיש סימונים על הכביש או שיש בכלל כביש. אנחנו עובדים בשטח מסוג אחר".

בעוד שאימון מכוניות ללא נהג "דורש כמות עצומה של נתוני אימון מתויגים", אומרת וויגנס, הרי שבסביבה הצבאית המצב שונה, "לכן אנחנו מתמקדים יותר בלמידה מכמויות קטנות של נתונים מתויגים. "באופן ספציפי, בפרויקט שלנו הרובוטים מאומנים לנווט לפי מאפייני סביבה תוך התבססות על דוגמאות שמספקים בני אדם".

חוקר בכיר בפרויקט מטעם מכון הרובוטיקה בקרנגי מלון, לואי נבארו-סרמנט, מספק דוגמא: "אם יש בדרך שלולית, בני אדם ינועו בצורה שתעקוף את השלולית. על ידי התבוננות, הרובוט לומד לעשות כמוהם. זהו סוג של חיקוי", הוא אומר.

במסגרת הפרויקט, גורמים אנושיים העניקו משקל לכל אחד מהמאפיינים בסביבה כדי לסייע לרובוטים ללמוד איך לפתור פקודות סותרות, כך מדווח defensesystems.com. "לדוגמא, אנחנו מאמנים את הרובוט לנסוע בדרך הסלולה ולהמנע מהדשא, וכך הוא לומד שהדרך מתאימה לנסיעה והדשא – לא", מסביר ג'ון רוג'רס מה-ARL. אבל כשנתנו לרובוט פקודה נוספת להמנע משדה הראיה של צלף, הרובוט היה צריך "לאזן בין שתי המטרות סימולטנית. עליו להפר את אחת ההתנהגויות". מניחים כי אם הגורמים השונים קיבלו כל אחד את המשקל הנכון, הרובוט יעדיף לנסוע על הדשא במקרה זה. "בסופו של דבר, הרובוט ילמד לפעול לצד החיילים כשהם מבצעים את משימותיהם והוא מבצע את מה שהוטל עליו", אומר רוג'רס.

פרויקט ה-ARL צפוי להסתיים בסתיו 2019, כולל הדגמה של טכנולוגיית הלמידה החדשה.