גיוון נתונים יכול להציל את הבינה המלאכותית

Feb 27, 2024

This post is also available in: English (אנגלית)

בינה מלאכותית מחוללת מהפכה בתעשיות רבות, כולל בתחום הבריאות. עם זאת, בינה מלאכותית טובה רק כמו הנתונים שעליהם היא מבוססת.

נתונים מוטים ועם "דעות קדומות" עלולים להוביל לתוצאות חמורות, כולל ניתוחים מיותרים ואפילו פספוס אבחון של סרטן. לדוגמה, בינה מלאכותית המשמשת רופא עור חייבת מספיק דוגמאות על אנשים עם גווני עור שונים, או שתחמיץ אבחנה קריטית של סרטן העור.

מאמר חדש שכותרתו "דגימה גנרטיבית של גיוון-איכות ללמידה עם נתונים סינתטיים" על ידי חוקרים במדעי המחשב של אוניברסיטת דרום קליפורניה מציע גישה חדשנית להתמודד עם הטיה בתהליכי אימון מודלי למידת מכונה, במיוחד בתחומי ייצור תמונה. לפי Techxplore, החוקרים השתמשו במשפחת אלגוריתמים הנקראים "אלגוריתמים לגיוון-איכות " (Quality-diversity algorithms) כדי ליצור מערכי נתונים סינתטיים מגוונים שיכולים "לסתום את הפערים" בנתוני האימון בעולם האמיתי באופן אסטרטגי.

הכותב הראשי של המאמר אלן צ'אנג אמר: "אני חושב שזו האחריות שלנו כמדעני מחשב להגן טוב יותר על כל הקהילות, כולל קבוצות מיעוט, במערכות שאנו מתכננים. אנו מקווים כי אופטימיזציית גיוון-איכות יכולה לעזור ליצור נתונים סינתטיים הוגנים עבור השפעות רחבות ביישומים רפואיים וסוגים אחרים של מערכות בינה מלאכותית".

בינה מלאכותית שימשה בעבר כדי ליצור נתונים סינתטיים, אבל זה יכול להיות בעייתי שכן ישנה סכנה של הפקת נתונים משוחדים או מוטים שייצרו עוד יותר הטייה במעגל שילך ויחמיר. עם זאת, אלגוריתמים של גיוון-איכות יכולים לשמש ליצירת פתרונות מגוונים לבעיה, ובמקרה זה הם שימשו לפתרון הבעיה של יצירת מערכי נתונים סינתטיים מגוונים.

כך הצליחו החוקרים ליצור מערך נתונים מגוון של כ-50,000 תמונות ב-17 שעות, אשר נבדק בהצלחה על עד ארבעה מדדים של גיוון – גוון עור, הצגה מגדרית, גיל ואורך שיער.

צ'אנג מסביר: "זהו כיוון מבטיח להגדלת המודלים באמצעות דגימה המודעת להטיה, ואנחנו מקווים שנוכל לסייע למערכות בינה מלאכותית לספק ביצועים מדויקים עבור כל המשתמשים".

שיטה זו מגדילה במיוחד את הייצוג של קבוצות מצטלבות (קבוצות עם זהויות מרובות), כמו למשל אנשים כהי-עור עם משקפיים.

תגלית זו מראה לראשונה כי מודלים גנרטיביים יכולים להשתמש בגיוון-איכות כדי לתקן מסווגים מוטים. עבודה זו היא צעד ראשון בכיוון של מתן אפשרות למודלים מוטים "לתקן את עצמם" על ידי יצירה איטרטיבית של נתונים סינתטיים, ואימונים מחדש עליהם.

גיוון נתונים יכול להציל את הבינה המלאכותית

כתבות אחרונות

הקשר בין גלי פיטורים לפריצות אבטחה בחברות

מסוק איירבוס מהפכני שובר שיאי מהירות

טיל החלל הגרעיני של ארה"ב מקצר משמעותית את המסע למאדים

מתקפת סייבר באוקראינה משביתה את החימום ל-600 בנייני מגורים

הנפילה העולמית של CrowdStrike וההשלכות של תוכנת אבטחת סייבר פולשנית

התנועה האופטימלית ביותר לרובוטים שואבת השראה מהליכה של לטאות

בינה מלאכותית לומדת לחזות ולשלוט בשריפות ענק

כנופיית הסייבר הרוסית NoName מתקיפה לאחר שחבריה נעצרו בספרד

צבא בריטניה מבצע ניסויים בטכנולוגייה לבישה לזיהוי לייזר ובקרת רחפנים

צ'יפ מוח חדש מחולל מהפכה בטיפול בחולי פרקינסון

חליפת חלל מהפכנית הופכת נוזלי גוף למי שתייה

מטוסי הקרב של Airbus מקבלים "טייסי משנה" מ-AI

הכשב"מים של אוקראינה נהיו קטלניים יותר

פריצת דרך ענקית בתחום תקשורת הלייזר בחלל

מודל AI משפר אנליזת סריקות לב ומזרז טיפול

נשק הלייזר המאפשר לצוללות להפיל לוויינים

התקלה ההיסטורית השפיעה על 8.5 מיליון מכשירי מייקרוסופט והובילה למתקפות סייבר

רחפן זעיר מקבל עיניי AI לניווט עצמאי

5,000 רחפנים עצמאיים טסו יחד בבטחה בניסוי מהפכני לתעבורת רחפנים

המכ"ם הסיני החדש המסוגל לגבור על המשבשים העוצמתיים ביותר של צבא...