מבוקשות שיטות חדשות למיפוי נתונים 

מבוקשות שיטות חדשות למיפוי נתונים 

This post is also available in: enEnglish (אנגלית)

נתוני מיפוי זמן, הכוללים מידע על זמן ותאריך במיקום גאוגרפי ועוקבים אחר מיקומו של אדם בפרק זמן מסוים, מסייעים במיוחד לארגונים האמונים על ביטחון הציבור. מאגרי נתונים גדולים בתחום ביטחון הציבור, שכוללים מידע על בריאות ומיקום, יוכלו לסייע לאפידמיולוגים לזהות את המקור וההתפשטות של זיהום או מחלה ולסייע לצוותים לספק תגובה בחירום במקרה של אסון בקנה מידה נרחב.

הבעיה היא שמאגרי הנתונים האלה כוללים פרטים אישיים מזהים. לדוגמא, פניה למוקד החירום כוללת את שם וכתובת הפונה וזמן הקריאה ועשויה לכלול בסופו של דבר גם מידע על האבחון הרפואי ומרשמים. גם במקרים שהנתונים אנונימיים, ניתן לשייך תיעוד עם נתונים אישיים, זמן ומקום למאגרי נתונים צד שלישי כדי לזהות במי מדובר.

לכן, מכון התקנים והטכנולוגיה הלאומי של ארה"ב – NIST – פרסם פניה לציבור בבקשה לסייע במציאת דרכים לביטול הזיהוי במאגרי הנתונים של סוכנויות ביטחון הציבור, כך שחוקרים ומבצעי מדיניות יוכלו להפיק תובנות תוך שמירה על פרטיות האזרח. 

בעזרת ביטול יכולת הזיהוי של נתונים שכוללים PII (מידע שניתן לזיהוי אישי), יוכלו החוקרים להבטיח שהנתונים יהיו שימושיים תוך הגבלת המידע על אדם כלשהו, בלי קשר למידע הקיים במקורות צד שלישי.

פרטיות דיפרנציאלית נחשבת לשיטה להגנת PII תוך שמירה על מספיק פרטים שיאפשרו שימוש. השיטה מוסיפה "רעש" או עיוותים לחלק מהתנונים כך שניתן יהיה להפיק מסקנות כלליות מניתוח הנתונים אבל לא ניתן יהיה להסיק מהסטטיסטיקות שיתקבלו מידע על אדם ספציפי.

האתגר שהכריז מכון NIST ב-1 באוקטובר בנושא פרטיות דיפרנציאלית לגבי מיפוי נתוני PII כולל שלוש תחרויות בהן ניתן ליישם שיטות של פרטיות דיפרנציאלית בנתוני מיפוי זמן. המטרה היא ליצור מפת דשבורד ששומרת על הפרטיות ומראה שינויים בחלקי מפה שונים לאורך זמן.

לפי gcn.com, המכון מחפש גם סיוע בפיתוח שיטות חישוב ודירוג, שיאפשרו הערכת הדיוק של האלגוריתמים שמבטלים זיהוי בנתוני המפה.