This post is also available in:
English (אנגלית)
מהנדסים מאוניברסיטת פרדו גילו כי בינה מלאכותית יכולה לאפשר אינטראקציה אינטואיטיבית בין הנוסע לרכב אוטונומי. המחקר, שצפוי להיות מוצג בכנס IEEE International Conference on Intelligent Transportation Systems, בוחן כיצד מודלי שפה גדולים כמו ChatGPT יכולים לאפשר לרכבים אוטונומים להבין טוב יותר את הנוסעים ולהגיב לפקודות שלהם, גם כאשר הן מרומזות.
בראשות זיראן וואנג, פרופסור בבית הספר ליילז להנדסת אזרחים ובנייה בפרדו, המחקר בוחן כיצד שילוב מודלים שפה גדולים עם מערכות AV יכול לשפר את יכולתם לפרש ולפעול לפי אינפוט שך הנוסעים. רכבים אוטונומים קיימים דורשים פקודות מפורשות ממשתמשים, לעתים קרובות באמצעות ממשקים מורכבים או פקודות קוליות מדויקות. עם זאת, מודלי שפה יכולים לפרש פקודות עקיפות יותר, משום שהם מאומנים על כמויות עצומות של נתוני טקסט ומשפרים את ההבנה שלהם באופן רציף. זה יכול לשפר באופן משמעותי את הדרך שבה רכבים אוטונומים מנהלים אינטראקציה עם הנוסעים.
במחקר שלהם, וואנג וצוותו השתמשו במודלי שפה כדי להפעיל את תכונות הנהיגה הקיימות של הרכב האוטונומי במקום לשלוט ישירות ברכב. הם אימנו את ChatGPT להתמודד עם מגוון פקודות, החל מבקשות פשוטות כמו "בבקשה סע מהר יותר" ועד לאינדיקציות עדינות יותר כגון "אני מרגיש קצת בחילה כרגע". המודלים תוכנתו להתחשב בגורמים שונים, כולל כללי התנועה, תנאי הכביש ונתונים מחיישנים כגון קלט מצלמה.
על פי TechXplore, הצוות בדק את התאוריה שלהם עם רכב אוטונומי ברמה ארבע, שהוא צעד אחד מתחת לאוטונומיה מלאה. במהלך הניסויים, מערכת זיהוי הדיבור של הרכב זיהתה פקודות של נוסעים ומודלי השפה סיפקו הוראות למערכת הנהיגה של הרכב, השולטת בהאצה, בלימה, היגוי ושינויי הילוך. חלק מהניסויים כללו אפילו שימוש במערכת זיכרון שזוכרת את העדפות העבר של הנוסע.
הניסויים כללו תרחישי נהיגה שונים כגון מהירויות כביש ותמרוני חניה. התוצאות הראו כי הרכב פעל היטב, והמשתתפים הביעו פחות אי נוחות בהשוואה לנסיעות ברכב סטנדרטי ברמה ארבע. השימוש במודלי שפה גדולים שיפר את ביצועי הרכב, כאשר המערכת מתאימה את עצמה לפקודות כולל כאלו שלא נתקלו בהן קודם לכן.
המחקר גילה כי מודלי שפה דורשים בממוצע 1.6 שניות לעיבוד פקודות – משך סביר לתרחישים לא קריטיים, אך דורש שיפור עבור נסיבות הדורשות תגובות מהירות יותר. בנוסף, בעוד שהמחקר יישם מנגנוני בטיחות כדי להימנע מפרשנויות שגויות של הבינה המלאכותית, "הזיה" או תגובות לא נכונות של מודלים אלה נותרות אתגר.
המחקר של וואנג גם מסתכל קדימה, ומתחשב בשילוב של מודלים AI אחרים ובאפשרות של רכבים אוטונומיים לתקשר אחד עם השני כדי לשפר את ניהול התנועה. פרויקטים עתידיים יבחנו באמצעות מודלים חזותיים גדולים לטיפול בתנאי מזג אוויר קיצוניים. ככל שטכנולוגיית הבינה המלאכותית מתקדמת, שילוב מודלים אלה במערכות רכבים אוטונומיים יכול לחולל מהפכה באינטראקציה עם הנוסעים ולשפר את חוויית הנסיעה הכוללת.
המאמר פורסם באתר arXiv.