גם רשתות נוירוניות שוכחות משימות

גם רשתות נוירוניות שוכחות משימות

neural network

This post is also available in: enEnglish (אנגלית)

מערכות חכמות צבאיות אמורות להמשיך ללמוד באופן מתמיד כישורים חדשים ככל שהן מבצעות משימות נוספות בשדה הקרב בכל מקום בעולם, בלי לשכוח את הכישורים שכבר למדו. "לדוגמא, כשמבצעים משימה אורבנית, רובוט המצויד בגלגלים יוכל ללמוד פרמטרים חדשים של ניווט בסביבה עירונית צפופה, אך הוא עדיין צריך לפעול ביעילות באזור מיוער, סביבה שפגש בעבר", מסבירה דר' מרי אן פילדס, מנהל תוכנית המערכות החכמות בלשכת המחקר של צבא ארה"ב, הפועלת במסגרת מעבד המחקר של פיקוד פיתוח יכולות לחימה בצבא האמריקאי.

כדי להתמודד עם האתגר, פרויקט במימון הצבא מייצר מסגרת חדשה עבור רשתות נוירוניות, המאפשרת למערכות בינה מלאכותית ללמוד טוב יותר משימות חדשות בלי לשכוח הרבה ממה שלמדו במשימות הקודמות.

החוקרים מאוניברסיטת צפון קרוליינה הדגימו גם כי השימוש במסגרת כדי ללמוד משימה חדשה יכול לשפר את יכולות הבינה המלאכותית לבצע משימות קודמות, תופעה שנקראת העברה לאחור.

המסגרת החדשה שהציע צוות החוקרים, למידה לצורך צמיחה, מיועדת ללמידה מתמשכת שמפרידה בין למידה המבוססת על מבנה הרשת לבין למידה של פרמטרי המודל. בניסויים, הציגה גישה זו ביצועים טובים יותר בהשוואה ללמידה מתמשכת.

“מערכות של רשתות נוירוניות עמוקות המבוססות בינה מלאכותית מיועדות ללימוד משימות צרות", מסביר זיליי לי, ממובילי המחקר, מועמד לדוקטורט באוניברסיטת צפון קרוליינה. "כתוצאה מכך, אחד הדברים שעשויים לקרות כשלומדים משימות חדשות הוא שמערכות עלולות לשכוח משימות ישנות, התופעה נקראת שיכחה קטסטרופלית. מערכות עלולות לשכוח דברים שלמדו גם כשאינן לומדות דברים חדשים.. גישת הלמידה המתמשכת לאורך החיים מנסה להתמודד עם הבעיה".

כדוגמא ניתן לחשוב על רשתות נוירוניות עמוקות כמו על צינור מלא בשכבות. הנתונים הגולמיים נכנסים לחלק העליון של הצינור, ותפוקות המשימות יוצאות מצידו התחתון. כל "שכבה" בצינור היא חישוב שיוצר מניפולציה בנתונים כדי לסייע לרשת לבצע את משימתה, לדוגמא זיהוי עצמים בתמונה דיגיטלית. ישנן דרכים רבות לסידור השכבות בצינור, המקבילות לארכיטקטורות רשת שונות, כך לפי ecnmag.com.

כשרשת למידה עמוקה נדרשת ללמוד משימה חדשה, המסגרת החדשה המוצעת מתחילה באופטימיזציה מפורשת של הארכיטקטורה העצבית באמצעות חיפוש. כלומר, כשהרשת ניגשת לכל אחת מהשכבות במערכת שלה היא יכולה לבחור אחד מתוך ארבעה דברים: לדלג על השכבה, להשתמש בה באותה דרך שהשתמשו בה משימות קודמות, לשנות אותה מעט, או ליצור שכבה חדשה לגמרי.

לאחר שלב זה, הרשת משתמשת בטופולוגיה חדשה כדי לאמן את עצמה בביצוע משימה, כמו בכל מערכת למידה עמוקה מבוססת בינה מלאכותית.