חוקרים מפתחים כלי לשיפור סיווג טקסטים במערכות בינה מלאכותית

אוקטובר 14, 2025

This post is also available in: English (אנגלית)

צוות מחקר ממעבדת מערכות מידע והחלטה (LIDS) של MIT פיתח שיטה חדשה להערכת ושיפור הדיוק של מערכות סיווג טקסט מבוססות בינה מלאכותית — טכנולוגיות שממלאות תפקיד הולך וגדל בסינון תוכן מקוון, תגובות צ’אטבוטים, ושירותים דיגיטליים במגזרים רבים.

מערכות סיווג אלה הן אלגוריתמים שמאומנים לקטלג טקסט — למשל: לאתר מידע שגוי, להבחין בין ביקורות מוצרים, או לזהות ייעוץ פיננסי בתוך תגובות של צ’אטבוטים. עם השימוש ההולך וגובר במודלי שפה בתחומים רגישים כמו בריאות, בנקאות ושירות לקוחות, הפכה הבטחת האמינות של סיווגי הטקסט לאתגר מרכזי.

על פי TechXplore, החוקרים מ-MIT פיתחו ערכת כלים בת שתי רכיבים שנועדה לבחון ולחזק את מערכות הסיווג. הרכיב הראשון, SP-Attack, מייצר דוגמאות "עוינות"(Adversarial Examples) – משפטים ששונו קלות כך שמשמעותם נותרת זהה, אך הם גורמים למערכת הסיווג להפיק תוצאה שונה. דוגמאות אלו חושפות חולשות בלוגיקה של המערכת. הרכיב השני, SP-Defense, משתמש בדוגמאות העוינות לצורך אימון חוזר של המודל ולשיפור עמידותו בפני שיבוש.

כדי לוודא שהשינויים לא משנים את משמעות המשפטים, השתמשו החוקרים במודלים שפתיים גדולים כדי לאמת את הדמיון הסמנטי בין המשפטים המקוריים והמשוכתבים. התוצאות חשפו כי אפילו שינויים מזעריים — לעיתים מילה בודדת — עלולים להפוך את תוצאת הסיווג. ניתוח נוסף גילה כי פחות מ־0.1% מהמילים באוצר המילים של המערכת אחראיות לחלק משמעותי מהשגיאות, מה שמאפשר למקד את הבדיקות על מילים "בעלות השפעה גבוהה".

בנוסף, המחקר מציג מדד חדש בשם p, המודד את רגישות המודל להתקפות עוינות ברמת המילה. בבדיקות, הכלים שפותחו הצליחו להפחית את שיעורי הצלחת ההתקפות העוינות בכמחצית בהשוואה לשיטות קודמות.

בעוד שטעויות סיווג עשויות להיראות שוליות בהקשרים כמו בידור או חדשות, בתחומים מפוקחים כמו ייעוץ רפואי, שירותים פיננסיים או אבטחת מידע, טעות כזו עלולה להיות קריטית. כאשר מתבצעות מיליארדי אינטראקציות שנוצרות בידי AI מדי יום, גם שיפור קטן ביכולת הסיווג של המערכת עשוי להוביל להשפעה משמעותית.

צוות MIT פרסם את הכלים שפותחו כקוד פתוח, במטרה לתמוך במאמצים רחבים לשיפור בטיחות הבינה המלאכותית ויישומה האחראי.

חוקרים מפתחים כלי לשיפור סיווג טקסטים במערכות בינה מלאכותית

כתבות אחרונות

מערכת סימולציה חדשה מדמה את הכאוס של שריפות ענק

הנהג הבא בשדה הקרב הוא בינה מלאכותית

מכ"ם חדש שנועד לזהות גם רחפנים וגם מטוסים

הטכנולוגיה שמעניקה לספינות מלחמה יותר טילים בלי להגדיל אותן

בינה מלאכותית נכנסת לניהול הסיכונים בשדות תעופה

בינה מלאכותית נגד בינה מלאכותית: הקרב על חשבונות אינסטגרם

סיכון הסייבר הגדול של הבינה המלאכותית אולי בכלל לא מגיע מהאקרים

העתיד של ההגנה האווירית: לייזר ובינה מלאכותית

הדור הבא של הניווט הצבאי לא תלוי בלוויינים

בינה מלאכותית אופטית עשויה לשנות את עתיד התקשורת

תוקפים מנצלים את האמון בפלטפורמות בינה מלאכותית

שדרוג חדש יעקוב אחרי כל שלב בטיסת הטיל האסטרטגי

מה קורה תחת לחץ? האימון שמגלה הכול

הדור הבא של התקשורת הצבאית הוא נייד

יותר ממטוס התרעה: מרכז פיקוד מעופף

טיל חמקן ארוך־טווח שנשאר מוסתר עד השיגור

בלי מנהיג, עם תיאום: הסוד של נחילי רובוטים

בינה מלאכותית שמנסה להבין את שדה הקרב גייסה 60 מיליון דולר

מהפכה בצילום: להתמקד בתנועה, לא בפריימים

כך נראה רחפן תקיפה לטווח של כמעט 1,000 ק״מ