המבחן האחרון של האנושות: יוזמה חדשה לאתגר מערכות בינה מלאכותית

ספטמבר 25, 2024

This post is also available in: English (אנגלית)

יוזמה פורצת דרך בשם Humanity’s Last Exam הושקה במטרה לקבוע את אמות המידה הגבוהות ביותר למערכות בינה מלאכותית. הפרויקט השאפתני הזה, שבראשו עומד המרכז לבטיחות בבינה מלאכותית (CAIS), שואף ליצור את מבחן הבינה המלאכותית הציבורי המאתגר ביותר בעולם באמצעות שאלות ממומחים בתחומים שונים.

לדברי דן הנדריקס, ראש CAIS, היוזמה מסמנת זינוק משמעותי במתודולוגיות הערכת בינה מלאכותית. "אנחנו אוספים את סדרת השאלות הקשה ביותר והרחבה ביותר אי פעם כדי להעריך עד כמה אנחנו קרובים להשגת AI ברמת מומחיות גבוהה ביותר על פני תחומים מגוונים", הוא אמר. מומחי טכנולוגיה מוזמנים להגיש את השאלות הקשות ביותר שלהם עד ה-1 בנובמבר, עם מאגר פרסים כולל של 500,000 דולר שזמין להצעות נבחרות.

היוזמה מעודדת את השתתפותם של אנשים בעלי ניסיון של יותר מחמש שנים בתחום טכני, בעלי דוקטורט או דוקטורנטים. משתתפים ששאלותיהם נבחרות לא רק יקבלו פרסים כספיים, אלא גם יצוינו כמחברים שותפים במחקר המלווה למאגר הנתונים החדש. 50 ההצעות המובילות יקבלו 5,000 דולר כל אחת, ו-500 השאלות הבאות יקבלו 500 דולר, מה שיעודד תחרות וחדשנות בקהילת הבינה המלאכותית.

Scale AI, חברת תוכנה מסן פרנסיסקו הידועה באספקת נתונים מתויגים להכשרת יישומי בינה מלאכותית מדגישה את הצורך ביוזמה זו, ומסבירה כי אמות המידה הנוכחיות הפכו לפשטניות מדי עבור מודלים מתקדמים של בינה מלאכותית, לכן זה חיוני לפתח בחינות קפדניות יותר. נכון לספטמבר, הדגם האחרון של OpenAI – Strawberry release, הדגים יכולות שכמעט ממקסמות את אמות המידה הקיימות, מה שמדגיש את הדחיפות להערכות מאתגרות יותר.

ההנחיות להגשת שאלות הן מחמירות: ההגשות חייבות להיות מקוריות, מאתגרות, אובייקטיביות ועצמאיות. השאלות צריכות לכלול מגוון רחב של תחומים. יש לציין כי היוזמה אוסרת על שאלות הקשורות לנושאים רגישים, כגון נשק להשמדה המונית או לוחמת סייבר, ומבטיחה להתמקד בשאלות קונסטרוקטיביות ובטוחות.

המחויבות של Scale AI לבטיחות AI ושיטות הערכה טובות נועדה להבחין בין מודלים המצטיינים בהערכות בסיסיות לבין אלה שיכולים לתרום למחקר מתקדם ופתרון בעיות. ככל שטכנולוגיית הבינה המלאכותית ממשיכה להתפתח, יוזמות כמו "המבחן האחרון של האנושות" חיוניות כדי לדחוף את הגבולות של מה שמערכות אלה מסוגלות להשיג.

למעוניינים להשתתף, ניתן למצוא את הנחיות ההגשה המפורטות ומידע חשוב באתר הרשמי. כאשר נוף הבינה המלאכותית משתנה, המבחן האחרון של האנושות מייצג צעד מרכזי לקראת פיתוח אמות מידה חזקות ויעילות לדור הבא של מערכות חכמות.

המבחן האחרון של האנושות: יוזמה חדשה לאתגר מערכות בינה מלאכותית

כתבות אחרונות

השדרוג החדש שמקצר את זמן התיקון של נשקי לייזר

חיישן ראייה חדש מחקה את העין האנושית כדי לשפר את הראייה...

הצצה רשמית ראשונה חושפת פרטים חדשים על מטוס הקרב מהדור השישי

שבב בינה מלאכותית זעיר עבר בהצלחה מבחני טיסה וחלל צבאיים

הרשת החדשה שמחברת את כל מערך ההגנה נגד רחפנים

עתיד הרובוטיקה עשוי להיות קטן יותר ממה שאתם חושבים

מרכז החדשנות INNOFENSE iHLS – מפגש סטארטאפים, בכירים וידע

מהטבע לטכנולוגיה: כך דגים משנים את הרובוטיקה התת־ימית

הטכנולוגיה החדשה שמאפשרת ליירט רחפנים גם תוך כדי נסיעה

פרצת האבטחה שנוצרה בעזרת בינה מלאכותית עלולה לפרוץ לאתר בתוך שניות

יותר עומק, פחות עייפות: העתיד של ראיית הלילה

הטכנולוגיה שמעניקה יתרון של קילומטרים מול רחפנים

נשק חדש משתמש באנרגיה אלקטרומגנטית, ולא בתחמושת, כדי להשבית רחפנים

הבינה המלאכותית שברחה מסביבת הניסוי – וביצעה מתקפת סייבר אמיתית

כך בינה מלאכותית יכולה לסייע בזיהוי מתקפות עוד לפני שהן מתחילות

כלי בינה מלאכותית חדש נועד להאיץ את קבלת ההחלטות בשדה הקרב

חוקרים עשו צעד משמעותי נוסף בדרך לרשתות דור שישי חכמות יותר

החיישנים שנועדו למכוניות מסייעים עכשיו לאתר רחפנים

כך כלב רובוטי מסייע לכבות שריפות באזורים מסוכנים

כך בלונים סטרטוספריים הופכים לכלי חדש באיסוף מודיעין