OpenAI משיקה מודלי בינה מלאכותית מתקדמים למשימות חשיבה מורכבות

דצמבר 25, 2024

This post is also available in: English (אנגלית)

OpenAI חשפה לאחרונה את דגמי ה-AI האחרונים שלה, O3 ו-O3 mini, המבטיחים להתמודד עם כמה מהבעיות המאתגרות ביותר בתחומים שונים, כולל מדע, כתיבת קוד ומתמטיקה. המודלים החדשים מהווים זינוק משמעותי בפיתוח הבינה המלאכותית של החברה, ונועדו להתמודד עם משימות מורכבות יותר ויותר הדורשות יכולות חשיבה מתקדמות.

סם אלטמן, מנכ"ל OpenAI, שיתף בשידור חי כי דגם ה-O3 mini יהיה זמין עד סוף ינואר, ודגם ה-O3 המלא יהיה זמין זמן קצר לאחר מכן. הוא הדגיש כי השקה זו מייצגת את תחילתו של עידן חדש בבינה מלאכותית, בו מודלים יכולים לבצע משימות הדורשות חשיבה לוגית משמעותית. על פי OpenAI, מודלי ה-O3 הם יעילים יותר ב-20% מאשר קודמיהם, דגמי O1, שהושקו מוקדם יותר השנה כדי לטפל בשאילתות מורכבות יותר.

תכונה בולטת של דגמי O3 היא הביצועים יוצאי הדופן שלהם בחשיבה מדעית ובמתמטיקה. מודל O3 השיג דיוק מרשים של 96.7% בתחרות המתמטיקה AIME 2024, וטעה רק בשאלה אחת. הוא גם קיבל ציון של 87.7% ב-GPQA Diamond, אמת מידה מדעית לחשיבה, ועלה על הביצועים של מומחים טיפוסיים ברמת דוקטורט. במבחן EPOCHAI Frontier Math, ה-O3 פתר 25.2% מהבעיות, שיפור משמעותי למול ה-2% של מודל O1. בחשיבה מושגית, מודל O3 עלה על ביצועים אנושיים עם ציון של 87.5% במדד ARC-AGI.

O3-mini, גרסה פשוטה יותר של המודל, מיועדת ליעילות, במיוחד במשימות כתיבת קוד. הוא מספק ביצועים יציבים עם עלויות מחשוב נמוכות יותר ומציע אופציה להגדיר את רמת הלוגיקה כנמוכה, בינונית או גבוהה, כך שהוא מתאים את יכולותיו למגוון יישומים.

בנוסף, OpenAI הציגה תכונת בטיחות חדשה, deliberative alignment, אשר משפרת את היכולת של המודלים לזהות ולנהל בקשות לא בטוחות, ומבטיחה תגובות AI מדויקות ואחראיות יותר.

ככל שמרוץ הבינה המלאכותית מתגבר, OpenAI הזמינה חוקרים חיצוניים לבחון את דגמי ה-O3, כאשר ההרשמה לכך נסגרת ב-10 בינואר, על פי רויטרס. זה מסמן שלב קריטי עבור החברה, שזכתה להצלחה מסחררת עם ChatGPT. עם מתחרים כמו Gemini 2.0 Flash Thinking של גוגל שגם מתקדם בתחום זה, התחרות לדייק מודלי הסקת מסקנות רק צפויה לגדול.

OpenAI משיקה מודלי בינה מלאכותית מתקדמים למשימות חשיבה מורכבות

כתבות אחרונות

20 מיליון דולר על הכוונת: שיתוף פעולה חדש בתחום החישה החכמה

ענקית דיפנס־טק בשווי 61 מיליארד דולר בדרך לישראל?

כך לוויינים ממשיכים לאסוף מודיעין בכל מזג אוויר

השדרוג החדש למקלע שנמצא בשירות כבר עשרות שנים

המערכת שמזהה, מסווגת ובוחרת איך לסכל כל רחפן

צוללת רובוטית חדשה למשימות חשאיות מתחת למים

מפעילי רחפנים יכולים כעת לשאת את כל תחנת השליטה על האפוד

מערכת אינטרקום צבאית חדשה מחזקת את רציפות הפיקוד והשליטה

כונן האחסון הזה עשוי להציל את הקבצים שלך גם אחרי מתקפת...

הרובה הזה מחליף קליבר בתוך דקה כדי להתאים את עצמו למשימה

הדור הבא של הגנת הכוחות: רחפן ישראלי חדש שמיירט רחפנים

הפנטגון מאשר: גרוק שימש לתמיכה בתקיפות באיראן

מערכת האבטחה הזו משתמשת בלייזרים כאוטיים במקום בסיסמאות

כך לחות הופכת למפתח למידע נסתר

בינה מלאכותית ותיקנים יוצרים סוג חדש של רובוטיקה

כך מתכת נוזלית עשויה לשנות את עתיד הרובוטים

מערכת האימות החדשה של גוגל מבקשת שתנופפו למצלמה

כך חרקים עשויים לשנות את עתיד הרחפנים

חיישן בינה מלאכותית חדש נועד לאתר מכ"מים שמסתתרים מהגילוי

תחבושת חכמה משתמשת בתאים מהונדסים כדי להאיץ ריפוי פצעים