קרובה יותר להשתלט על העולם? מודלי בינה מלאכותית מתנהגים כמו בני אדם באינטראקציות קבוצתיות אחד עם השני

Image by Unsplash

This post is also available in: English (אנגלית)

בגילוי שנראה כאילו יצא מספר מדע בדיוני, מחקר חדש גילה כי מודלי שפה גדולים (LLM) יכולים ליצור באופן ספונטני מוסכמות חברתיות כאשר הם ממוקמים באינטראקציות קבוצתיות, ללא כל תכנות מפורש לעשות זאת. המחקר, שפורסם בכתב העת Science Advances תחת הכותרת "Emergent Social Conventions and Collective Bias in LLM Populations", מציע כי סוכני AI מסוגלים לחקות את הדרך שבה קהילות אנושיות מייצרות נורמות באופן אורגני.

המחקר, שנערך על ידי מדענים מסיטי סנט ג'ורג', אוניברסיטת לונדון, ואוניברסיטת ה-IT של קופנהגן, בחן מה קורה כאשר LLM מרובים מתנהלים אחד עם השני בסדרה של אינטראקציות מובנות, אך ללא פיקוח. שלא כמו מחקרים קודמים שהתמקדו בהתנהגות של סוכן יחיד, עבודה זו בחנה דינמיקה קולקטיבית, וחשפה כי מודלי שפה מסוגלים לארגון עצמי חברתי.

באמצעות גרסה מותאמת של "משחק השמות" – מסגרת ממדעי החברה האנושית – החוקרים בחנו קבוצות של סוכני AI שנעו בין 24 ל-200 יחידים. בכל סיבוב, זוג סוכנים אקראי התבקש לבחור שם עבור אובייקט מתוך רשימה משותפת. אם שניהם בחרו את אותו השם, הם קיבלו פרס. אם לא, הם נענשו והראו אחד לשני את הבחירה, על פי TechXplore.

חשוב לציין, לסוכני הבינה המלאכותית הייתה גישה רק להיסטוריה קצרה של האינטראקציות שלהם עצמם ולא היו מודעים לכך שהם חלק מאוכלוסייה גדולה יותר. אף על פי כן, הופיעה לעתים קרובות מוסכמה קבוצתית למתן שמות במשך הזמן – באופן ספונטני לחלוטין וללא תיאום מרכזי.

התנהגות זו משקפת באופן הדוק כיצד נורמות חברתיות ומוסכמות לשוניות מתפתחות בחברות אנושיות. באופן מעניין יותר, חוקרים גילו גם כי הטיות קולקטיביות יכולות להיווצר בתוך הקבוצה – הטיות שאינן קיימות אצל סוכנים בודדים, אלא נובעות אך ורק מדינמיקה קבוצתית.

ניסויים נוספים הראו כי נורמות אלה עשויות להיות בלתי יציבות באופן מפתיע. מקבץ קטן של סוכנים שיציגו דפוס שמות חדש יכול להשפיע על המערכת כולה, מה שמדמה תופעה מוכרת מעולם בסוציולוגיה.

המחקר השתמש במספר ארכיטקטורות LLM, מה שמדגיש את העובדה כי תופעה זו מתרחשת על פני מודלים שונים. המודלים הם Llama-2-70B-Chat, Llama-3-70B-Instruct, Llama-3.1-70B-Instruct, ו-Claude-3.5-Sonnet

ממצאים אלה מהווים פסגה חדשה במחקר הבינה המלאכותית: הבנה כיצד אוכלוסיות של מערכות בינה מלאכותית אוטונומיות עשויות לפתח התנהגויות משותפות, ללא תלות בפיקוח אנושי. ככל ש- LLM הופך מוטבע יותר ויותר בפלטפורמות בכל עולמות חיינו, היכולת לחזות ולנהל התנהגויות מתהוות אלה תהיה חיונית לבטיחות לטווח ארוך וניהול אתי שלהם.