הפיתוי לתת למחשבים לטפל לבד בכל הבעיות יכול להיות בעייתי מבחינת ביג...

הפיתוי לתת למחשבים לטפל לבד בכל הבעיות יכול להיות בעייתי מבחינת ביג דאטה

This post is also available in: enEnglish (אנגלית)

15952269_sביג דאטה (Big Data) – או "מידע גדול" בתרגום מילולי לאנגלית, הוא לאו דווקא מידע מועיל. מומחים רבים טוענים לאחרונה שבעזרת ביג דאטה לא ניתן אוטומטית להפיק נתונים אמיתיים. אם המידע לא שלם, לא בהקשר הנכון או פגום בדרכים אחרות, שימוש בו עלול להוביל לפגיעה בתחרותיות של ארגון או בחיים האישיים של אנשים פרטיים.

לפי Security Leadership אחד הסיפורים הקלאסיים שממחישים את הבעיה מגיעים מאוניברסיטת הרווארד, וספציפית מהפרופסור גארי קינג (Gary King) מהמכון למדעי החברה (Institute for Quantitative Social Science). במהלך פרויקט ביג דאטה החוקרים ניסו לנתח ציוצי טוויטר ורשתות חברתיות אחרות כדי לנבא נתוני אבטלה עתידיים בארצות הברית. הם עשו זאת על ידי חיפוש אחר מילות מפתח כמו "עבודה", “תעסוקה", “דרושים" וכדומה. בעזרת טכניקת אנליטיקה בשם Sentiment Analysis החוקרים אספו הודעות שכללו את המילים האלו כדי לראות האם יש התאמה בין ההופעה שלהן לבין נתוני האבטלה החודשיים.

במהלך הבדיקה החוקרים שמו לב לעליית עצומה במספרי ההודעות שכללו אחת מהמילים הללו או יותר. עם זאת, פרופסור קינג שם לב יותר מאוחר שלתופעה לא היה שום קשר לנתוני אבטלה. “החוקרים לא שמו לב שסטיב ג'ובס מת", אמר קינג.

iHLS – Israel Homeland Security

פרט למותו בטרם עת של ג'ובס הסיפור אולי נשמע משעשע, אבל הלקח שנובע ממנו רציני מאוד עבור אלו שמסתמכים על ביג דאטה בתהליך קבלת ההחלטות שלהם.

לדברי קינג הבלבול הוא רק אחד מסיפורים דומים רבים. כל אחד שעובד בתחום חווה חוויות דומות. “מילות מפתח שמחברים בני אדם עובדות טוב לטווח הקצר, אבל נוטות להכשל בצורה נוראית בטווח הארוך", אמר, והוסיף "אפשר לשפר את המצב על ידי הוספת יוצאי דופן, אבל זה דורש הרבה מאוד עבודה".

קינג מספר שכל אחד יכול לחוות את התופעה על בשרו על ידי הכנסת מילת מפתח למנוע חיפוש. "בתחילה עולות תוצאות רלוונטיות ותוצאות שאינן רלוונטיות. אם לא משנים את מילות המפתח ובוחנים את התוצאות לאורך זמן, בדרך כלל התוצאות סוטות מהכיוון הרצוי – לפעמים בצורה מתונה ולפעמים בצורה קיצונית", אמר.

ועדיין, לדברי הפרופסור השימוש בביג דאטה עדיין מביא לתוצאות שימושיות בחלק מהמקרים, כך שלמרות הכל הכשלונות נוטים שלא להופיע בספרות המקצועית. קים ג'ונס, סגן נשיא Vantiv, אמר שהבעיה לא חדשה, אבל היא בעיה שהולכת ומחמירה אם אנשים ימשיכו להאמין שאפשר סתםכך להפיק נתונים מועילים מתוך כמויות מידע אדירות.