Home סייבר אבטחת סייבר אנתרופיק חושפת את מודל הבינה המלאכותית המתקדם ביותר שלה עד כה

אנתרופיק חושפת את מודל הבינה המלאכותית המתקדם ביותר שלה עד כה

Representational image of claude

This post is also available in: English (אנגלית)

ככל שמודלי בינה מלאכותית הופכים מתקדמים יותר, ניצבים מפתחים בפני אתגר הולך וגובר: כיצד להנגיש מערכות עוצמתיות לציבור הרחב מבלי להגדיל במקביל את הסיכון לשימושם לרעה. מודלים מתקדמים יכולים לסייע בפיתוח תוכנה, בניתוחים מדעיים ובהסקת מסקנות מורכבות, אך אותן יכולות עצמן עשויות לשמש גם למתקפות סייבר, למחקר מסוכן או לניסיונות לעקוף מנגנוני בטיחות.

מודל חדש בשם Claude Fable 5 מנסה לאזן בין הדרישות הסותרות הללו באמצעות שילוב של ביצועים ברמת חזית הטכנולוגיה עם מערכת מובנית שנועדה להגביל גישה ליכולות מסוימות בעלות סיכון גבוה.

זהו המודל הציבורי הראשון המבוסס על טכנולוגיית Mythos-Class של Anthropic – קטגוריה שעד כה הייתה זמינה רק לקבוצה מצומצמת של ארגונים מאושרים. לפי החברה, המערכת מציגה שיפורים משמעותיים בתחומי התכנות, החשיבה האנליטית, ההבנה המדעית וניתוח מידע חזותי בהשוואה למודלים קודמים שהיו זמינים לציבור.

מה שמייחד את ההשקה הוא הארכיטקטורה שסביבה. במקום להעניק גישה בלתי מוגבלת לכל היכולות, המודל בוחן באופן רציף את הבקשות המתקבלות באמצעות מסווגים מבוססי בינה מלאכותית. מסווגים אלו מזהים פניות בתחומים רגישים כגון סייבר, ביולוגיה, כימיה או ניסיונות להשפיע על התנהגות המודל עצמו.

כאשר מזוהה בקשה שעשויה להיות רגישה, המערכת מעבירה באופן אוטומטי את השיחה למודל מוגבל יותר, שנועד להפעיל מנגנוני בטיחות מחמירים יותר. המשתמשים מקבלים הודעה כאשר מעבר כזה מתבצע, כך שנוצרת הבחנה ברורה בין שימוש רגיל לבין בקשות המפעילות שכבת הגנה נוספת.

על פי דיווח של Interesting Engineering, החברה מציינת כי המנגנון עבר בדיקות מקיפות לפני ההשקה. בהערכות מוקדמות נמצא כי פחות מחמישה אחוזים מהשיחות דרשו התערבות, אם כי בקשות לגיטימיות מסוימות עשויות לעבור למסלול המוגבל כאמצעי זהירות.

מעבר למנגנוני הבטיחות, המודל תוכנן להתמודד עם משימות מורכבות וארוכות טווח. הוא נועד לשמור על עקביות לאורך כמויות מידע גדולות ותהליכי עבודה ממושכים. בין ההדגמות שהוצגו נכללו פרויקטי תוכנה רחבי־היקף, ניתוחים פיננסיים מתקדמים, פירוש תרשימים מדעיים ומשימות חשיבה חזותית מורכבות.

מנקודת מבט של סייבר וביטחון, ההשקה משקפת מגמה הולכת וגוברת בעולם הבינה המלאכותית: הפרדה בין גישה כללית למודלים מתקדמים לבין גישה ליכולות בעלות סיכון גבוה. במקום להגביל לחלוטין מודלים עוצמתיים, מפתחים בוחנים יותר ויותר מנגנוני גישה רב־שכבתיים המתאימים את רמת ההרשאות באופן דינמי בהתאם לאופי הבקשה.

במקביל, גרסה פחות מוגבלת של טכנולוגיית Mythos-Class נותרת זמינה רק לארגונים מאושרים, בעיקר כאלה העוסקים בהגנת סייבר ובהגנה על תשתיות קריטיות.

ההשקה מסמלת צעד נוסף בניסיון של התעשייה לבחון האם ניתן לפרוס מערכות בינה מלאכותית מתקדמות בקנה מידה רחב, תוך שמירה על מנגנוני הגנה משמעותיים סביב היכולות הרגישות ביותר שלהן.