This post is also available in:
English (אנגלית)
יצירת סביבות דיגיטליות אינטראקטיביות הניתנות לשליטה היא משימה מורכבת ודורשת משאבים רבים. היכולת לייצר עולם וירטואלי מגיב באמצעות הנחיה פשוטה, במקום תכנות מקיף, היוותה עד כה אתגר משמעותי בתחום הבינה המלאכותית.
טכנולוגיה חדשה של גוגל, המכונה פרויקט ג'יני, מציגה פתרון פורץ דרך. סביבה אינטראקטיבית וגנרטיבית זו מסוגלת ליצור עולם משחק דו-ממדי שלם בסגנון פלטפורמה, וזאת מתמונת סטילס בודדת. הדבר מסמן מעבר מבינה מלאכותית שרק יוצרת תוכן למערכת שבונה מרחבים וירטואליים דינמיים הנשלטים על ידי המשתמש.
בליבת המערכת עומד מודל יסוד בעל 11 מיליארד פרמטרים. על פי דיווח של Forbes, אימון המודל התבסס על מאגר מידע עצום של יותר מ-200,000 שעות וידאו ממשחקי פלטפורמה דו-ממדיים הזמינים ברשת. אימון מבוסס וידאו בלבד זה אפשר למערכת ללמוד באופן מרומז את מכניקת המשחק, חוקי הפיזיקה והשליטה בדמויות, ללא צורך בתגיות או בתיאור מפורש של הפעולות המבוצעות.
המערכת פועלת באמצעות תהליך מתוחכם בן שלושה חלקים. ראשית, רכיב מיוחד (tokenizer) ממיר את פריימי הווידאו לאסימונים דיגיטליים. לאחר מכן, מודל פעולה מנתח את היחסים בין הפריימים כדי להסיק את הפעולות הסמויות המתרחשות. לבסוף, מודל דינמיקה חוזה את הפריים הבא בהתבסס על הפריים הנוכחי ועל פעולה נתונה, ובכך הופך את העולם הסטטי למגיב לקלט מהמשתמש.
ההשלכות של "מודלי עולם" מסוג זה חורגות באופן משמעותי אל המגזר הביטחוני. ניתן להשתמש בטכנולוגיה זו לאימון מערכות רובוטיות אוטונומיות במגוון רחב של תרחישים מדומים. היא מאפשרת יצירה מהירה של "תאומים דיגיטליים" של שדות קרב לצורך תרגול משימות, תוך שימוש בתמונת לוויין או בצילום רחפן כהנחיה ראשונית. יתרה מכך, היא מציעה כלים רבי עוצמה למשחקי מלחמה ותכנון אסטרטגי, המאפשרים למפקדים לדמות תנועות אויב ולבחון תגובות טקטיות בסביבות שנוצרו באופן דינמי.
פיתוח זה מהווה צעד מכריע לקראת בינה מלאכותית שלא רק תופסת ומתארת את העולם, אלא גם מסוגלת לדמות אותו באופן אינטראקטיבי. היכולת לייצר תרחישים שניתן לשחק בהם מקלט מינימלי פותחת אופקים חדשים לאימון, בידור וניתוח אסטרטגי, ומטשטשת את הגבולות בין המציאותי לבין המדמה הווירטואלי.

























