This post is also available in: English (אנגלית)
OpenAI חשפה לאחרונה את דגמי ה-AI האחרונים שלה, O3 ו-O3 mini, המבטיחים להתמודד עם כמה מהבעיות המאתגרות ביותר בתחומים שונים, כולל מדע, כתיבת קוד ומתמטיקה. המודלים החדשים מהווים זינוק משמעותי בפיתוח הבינה המלאכותית של החברה, ונועדו להתמודד עם משימות מורכבות יותר ויותר הדורשות יכולות חשיבה מתקדמות.
סם אלטמן, מנכ"ל OpenAI, שיתף בשידור חי כי דגם ה-O3 mini יהיה זמין עד סוף ינואר, ודגם ה-O3 המלא יהיה זמין זמן קצר לאחר מכן. הוא הדגיש כי השקה זו מייצגת את תחילתו של עידן חדש בבינה מלאכותית, בו מודלים יכולים לבצע משימות הדורשות חשיבה לוגית משמעותית. על פי OpenAI, מודלי ה-O3 הם יעילים יותר ב-20% מאשר קודמיהם, דגמי O1, שהושקו מוקדם יותר השנה כדי לטפל בשאילתות מורכבות יותר.
תכונה בולטת של דגמי O3 היא הביצועים יוצאי הדופן שלהם בחשיבה מדעית ובמתמטיקה. מודל O3 השיג דיוק מרשים של 96.7% בתחרות המתמטיקה AIME 2024, וטעה רק בשאלה אחת. הוא גם קיבל ציון של 87.7% ב-GPQA Diamond, אמת מידה מדעית לחשיבה, ועלה על הביצועים של מומחים טיפוסיים ברמת דוקטורט. במבחן EPOCHAI Frontier Math, ה-O3 פתר 25.2% מהבעיות, שיפור משמעותי למול ה-2% של מודל O1. בחשיבה מושגית, מודל O3 עלה על ביצועים אנושיים עם ציון של 87.5% במדד ARC-AGI.
O3-mini, גרסה פשוטה יותר של המודל, מיועדת ליעילות, במיוחד במשימות כתיבת קוד. הוא מספק ביצועים יציבים עם עלויות מחשוב נמוכות יותר ומציע אופציה להגדיר את רמת הלוגיקה כנמוכה, בינונית או גבוהה, כך שהוא מתאים את יכולותיו למגוון יישומים.
בנוסף, OpenAI הציגה תכונת בטיחות חדשה, deliberative alignment, אשר משפרת את היכולת של המודלים לזהות ולנהל בקשות לא בטוחות, ומבטיחה תגובות AI מדויקות ואחראיות יותר.
ככל שמרוץ הבינה המלאכותית מתגבר, OpenAI הזמינה חוקרים חיצוניים לבחון את דגמי ה-O3, כאשר ההרשמה לכך נסגרת ב-10 בינואר, על פי רויטרס. זה מסמן שלב קריטי עבור החברה, שזכתה להצלחה מסחררת עם ChatGPT. עם מתחרים כמו Gemini 2.0 Flash Thinking של גוגל שגם מתקדם בתחום זה, התחרות לדייק מודלי הסקת מסקנות רק צפויה לגדול.