Home טכנולוגיה Big Data דליפת הפרטיות הראשונה בתחום הבינה המלאכותית שמקורה בחומרה

דליפת הפרטיות הראשונה בתחום הבינה המלאכותית שמקורה בחומרה

Representational image

This post is also available in: English (אנגלית)

חוקרים גילו חולשה שלא הייתה ידועה קודם לכן בחומרת בינה מלאכותית, אשר ניתן לנצל כדי לחשוף מידע פרטי על נתוני האימון של מודלים – וזאת מבלי לגשת לזיכרון של המודל או לפלטים שלו.

על פי דיווח של TechXplore, מחקר מאוניברסיטת צפון קרוליינה גילה כשל במאיצים ללמידת מכונה (ML accelerator), אשר משתמשים בחומרה ייעודית שמטרתה להאיץ חישובי בינה מלאכותית ולשפר את היעילות האנרגטית. החולשה, שנקראת GATEBLEED, מאפשרת לתוקפים להסיק אם נתון מסוים שימש לאימון מודל למידת מכונה, ע"י מעקב אחר שינויים עדינים בזמני הביצוע של פעולות העיבוד.

שלא כמו מתקפות מסורתיות שמתבססות על שליפת מידע מהזיכרון או ניתוח פלטי המודל, שיטה זו עושה שימוש אך ורק בנתוני תזמון ברמת התוכנה כדי להתבונן בהתנהגות המאיצים כאשר הם מעבדים קלטים מוכרים מול קלטים שלא נראו בעבר. ההתקפה מנצלת תכונה ברמת החומרה בשם power-gating – מנגנון שחוסך באנרגיה על ידי כיבוי והדלקה של חלקים שונים בשבב לפי הצורך – אך באופן לא מכוון, יוצר ערוץ צדדי שדרכו דולף מידע רגיש.

המחקר התמקד בהרחבות המטריצות המתקדמות של אינטל (Intel’s Advanced Matrix Extensions – AMX), אשר הוצגו לראשונה במעבדי הדור הרביעי של Xeon Scalable. מאיצים אלו נמצאים בשימוש הולך וגובר במעבדים כלליים לצורך תמיכה בעומסי בינה מלאכותית במגוון תעשיות.

GATEBLEED אינו דורש גישה מנהלית או הרשאות מערכת גבוהות. תוכנה קלת-משקל שרצה על אותו שרת יכולה לעקוב אחר זמני הביצוע ולזהות התאמות לנתוני האימון, אפילו במודלים בקנה מידה גדול. החולשה מתבטאת ביתר שאת ברשתות עצביות עמוקות, ולא ניתן למתן אותה ע"י אמצעים סטנדרטיים כגון הסתרת פלטים או ניטור צריכת חשמל.

הטכניקה משפיעה גם על מודלים מסוג Mixture of Experts (MoE) – ארכיטקטורה שהולכת וגדלה בתחום עיבוד השפה הטבעית – בכך שהיא חושפת אילו מודולים "מומחים" הופעלו בזמן תהליך ההסקה, מה שעלול לחשוף מידע פרטי נוסף.

מכיוון שהכשל טמון בעיצוב החומרה עצמה, קשה לתקן אותו, והוא ניתן לניצול גם ללא גישה פיזית לשרת. תיקוני חומרה עשויים להימשך שנים עד ליישומם, ופתרונות זמניים ברמת התוכנה עלולים לפגוע בביצועי המודלים או להעלות את צריכת האנרגיה.

הממצא מדגיש את הצורך בגיבוש אסטרטגיות חדשות לאבטחת מערכות בינה מלאכותית, מבלי לוותר על היתרונות שמספקים מאיצי הבינה. טיפול בחולשות מסוג GATEBLEED ככל הנראה ידרוש שילוב בין שינויים בעיצוב החומרה העתידית לבין חיזוק מנגנוני ההגנה ברמת המערכת בטווח הקצר. ללא צעדים אלה, שימוש נרחב של מאיצי בינה מלאכותית עלול לחשוף משתמשים וארגונים לסיכונים חדשים.