המבחן האחרון של האנושות: יוזמה חדשה לאתגר מערכות בינה מלאכותית

Image by Unsplash

This post is also available in: English (אנגלית)

יוזמה פורצת דרך בשם Humanity’s Last Exam הושקה במטרה לקבוע את אמות המידה הגבוהות ביותר למערכות בינה מלאכותית. הפרויקט השאפתני הזה, שבראשו עומד המרכז לבטיחות בבינה מלאכותית (CAIS), שואף ליצור את מבחן הבינה המלאכותית הציבורי המאתגר ביותר בעולם באמצעות שאלות ממומחים בתחומים שונים.

לדברי דן הנדריקס, ראש CAIS, היוזמה מסמנת זינוק משמעותי במתודולוגיות הערכת בינה מלאכותית. "אנחנו אוספים את סדרת השאלות הקשה ביותר והרחבה ביותר אי פעם כדי להעריך עד כמה אנחנו קרובים להשגת AI ברמת מומחיות גבוהה ביותר על פני תחומים מגוונים", הוא אמר. מומחי טכנולוגיה מוזמנים להגיש את השאלות הקשות ביותר שלהם עד ה-1 בנובמבר, עם מאגר פרסים כולל של 500,000 דולר שזמין להצעות נבחרות.

היוזמה מעודדת את השתתפותם של אנשים בעלי ניסיון של יותר מחמש שנים בתחום טכני, בעלי דוקטורט או דוקטורנטים. משתתפים ששאלותיהם נבחרות לא רק יקבלו פרסים כספיים, אלא גם יצוינו כמחברים שותפים במחקר המלווה למאגר הנתונים החדש. 50 ההצעות המובילות יקבלו 5,000 דולר כל אחת, ו-500 השאלות הבאות יקבלו 500 דולר, מה שיעודד תחרות וחדשנות בקהילת הבינה המלאכותית.

Scale AI, חברת תוכנה מסן פרנסיסקו הידועה באספקת נתונים מתויגים להכשרת יישומי בינה מלאכותית מדגישה את הצורך ביוזמה זו, ומסבירה כי אמות המידה הנוכחיות הפכו לפשטניות מדי עבור מודלים מתקדמים של בינה מלאכותית, לכן זה חיוני לפתח בחינות קפדניות יותר. נכון לספטמבר, הדגם האחרון של OpenAI – Strawberry release, הדגים יכולות שכמעט ממקסמות את אמות המידה הקיימות, מה שמדגיש את הדחיפות להערכות מאתגרות יותר.

ההנחיות להגשת שאלות הן מחמירות: ההגשות חייבות להיות מקוריות, מאתגרות, אובייקטיביות ועצמאיות. השאלות צריכות לכלול מגוון רחב של תחומים. יש לציין כי היוזמה אוסרת על שאלות הקשורות לנושאים רגישים, כגון נשק להשמדה המונית או לוחמת סייבר, ומבטיחה להתמקד בשאלות קונסטרוקטיביות ובטוחות.

המחויבות של Scale AI לבטיחות AI ושיטות הערכה טובות נועדה להבחין בין מודלים המצטיינים בהערכות בסיסיות לבין אלה שיכולים לתרום למחקר מתקדם ופתרון בעיות. ככל שטכנולוגיית הבינה המלאכותית ממשיכה להתפתח, יוזמות כמו "המבחן האחרון של האנושות" חיוניות כדי לדחוף את הגבולות של מה שמערכות אלה מסוגלות להשיג.

למעוניינים להשתתף, ניתן למצוא את הנחיות ההגשה המפורטות ומידע חשוב באתר הרשמי. כאשר נוף הבינה המלאכותית משתנה, המבחן האחרון של האנושות מייצג צעד מרכזי לקראת פיתוח אמות מידה חזקות ויעילות לדור הבא של מערכות חכמות.