מחקר מצא כי מודלים של בינה מלאכותית מסווגים את העולם כמו בני אדם

Image by Unsplash

This post is also available in: English (אנגלית)

מחקר חדש שפורסם ב-Nature Machine Intelligence מגלה כי מודלי שפה עשויים לפתח באופן עצמאי יכולות הדומות ליכולות קוגניטיביות של בני אדם, לסווג ולפרש אובייקטים טבעיים – באופן שמחקה מרכיב מרכזי בתפיסה האנושית.

חוקרים מהאקדמיה הסינית למדעים ואוניברסיטת דרום סין לטכנולוגיה בדקו מספר מערכות בינה מלאכותית, כולל ChatGPT-3.5 ו-Gemini Pro Vision, כדי לקבוע אם LLM יכולים למיין באופן ספונטני מידע בצורה אנושית. תוך שימוש במשימות "מצא את ההבדלים" על פני 1,854 אובייקטים טבעיים – החל מבעלי חיים ומזון ועד כלים וכלי רכב – הצוות אסף יותר מ-4.7 מיליון תגובות שנוצרו על ידי הבינה המלאכותית.

התוצאות הראו כי המודלים ארגנו את האובייקטים הללו לאורך 66 ממדים רעיוניים שונים. אלה הגיעו הרבה מעבר לקטגוריות פשוטות כגון "פירות" או "רהיטים" וכללו תכונות מופשטות כמו רלוונטיות רגשית, מרקם, וכמה הם מתאימים לשימוש על ידי ילדים. דפוס זה של סיווג משקף כיצד בני אדם מקבצים אובייקטים באופן אינטואיטיבי – לא רק לפי סוג, אלא גם לפי הקשר ומשמעות.

באופן מעניין, נמצא כי מודלים מולטי-מודאליים, המשלבים קלט חזותי וטקסטואלי, הראו התאמה גדולה אף יותר עם הקוגניציה האנושית. מערכות אלה עיבדו רמזים חזותיים וסמנטיים בו זמנית, מה שגרם לכך שהאופן שסידרו אובייקטים דמה אפילו יותר לאופן שבו המוח שלנו עושה זאת.

השוואות הדמיה מוחית הוסיפו שכבה נוספת של תובנה: אזורי המוח שהופעלו במהלך קטגוריזציה של אובייקטים אנושיים הראו חפיפה משמעותית עם דפוסים שנצפו בתגובות מודל AI, על פי Interesting Engineering. הדבר מצביע על כך שמודלי שפה עשויים להגיע לאסטרטגיות דומות מבחינה פונקציונלית לאלה של המוח האנושי – לפחות כשמדובר במיון מידע והקשריו.

עם זאת, החוקרים מזהירים כי בעוד שזיהוי תבנית זה דומה להבנה אנושית, הוא אינו מבוסס על ניסיון חי או אינטראקציה חושית. מערכות בינה מלאכותית לא "מבינות" חפצים מבחינה רגשית או פיזית. במקום זאת, הן משקפות דפוסים סטטיסטיים שנלמדו ממערכי נתונים מסיביים.

עם זאת, המחקר מאתגר את האמונה כי מודלי בינה מלאכותית רק מהדהדים נתונים. אם המודלים האלה מתחילים לבנות מסגרות מושגיות פנימיות, זה יכול לאותת על צעד לקראת בינה מלאכותית אינטואיטיבית יותר, ואולי אפילו לקראת בינה מלאכותית כללית.