תוכנה לזיהוי דיבור במיקור-המונים ביוזמת גורמי מודיעין

תוכנה לזיהוי דיבור במיקור-המונים ביוזמת גורמי מודיעין

Illustration

This post is also available in: enEnglish (אנגלית)

Illustration
אילוסטרציה

הסוכנות לפרוייקטים של מחקר מודיעיני מתקדם (Advanced Research Projects Activity – IARPA) מבקשת לקבל מן הציבור רעיונות שיקלו על ניתוח הדיבור האנושי בסביבות רועשות ותרגומו לנתונים המועדים פחות לטעויות.

תוכנה לזיהוי דיבור ממירה דברים שנאמרו לטקסט כתוב. מדובר בפעולה המתבצעת במגוון דרכים. עם זאת, כשם שתוכנת סירי, למשל, לא תמיד מזהה מה נאמר, תוכנות אלו 'טועות' לא אחת, לעיתים עקב רעשי רקע המבליעים את הנאמר.

זהו סוג הבעיות אשר הניעו את IARPA ואת זרוע המחקר של המודיעין הלאומי בארה"ב (ODNI – Office of the Director of National Intelligence), ליזום תחרות חדשה של רעיונות שיתקבלו מן הציבור ומחברות מסחריות כיצד להתגבר על הקשיים המעיבים על ביצועיהן של תוכנות לזיהוי דיבור.

התחרות, המכונה 'אתגר זיהוי דיבור אוטומטי בסביבה רועשת' (Automatic Speech in Reverberant Environments – ASpIRE), כוללת פרס של 50 אלף דולר לרעיונות חדשניים.

קישור לאתר ביטחון המולדת

"אנו עוברים עדיין על הפרטים הסופיים של התחרות ומגבשים אותם, לרבות מועדה," מסרה דוברת IARPA שירה מדן (Schira Madan) במייל ששלחה. "לעת עתה, המידע שפרסמנו באתר שלנו מהווה סוג של מודעת טיזר," הוסיפה.

אתגר ASpIRE מתאר את התוכנה לפיענוח אוטומטי של שיח במגוון סביבות אקוסטיות ותסריטי הקלטה במונח "הגביע הקדום של קהילת מחקר הדיבור". הפרוייקט צמח מתוך יוזמת "בבל" (Babel) של IARPA, המבקשת לפתח טכנולוגיה גמישה לזיהוי קול אותה ניתן ליישם בכל שפה. המטרה: לסייע לאנליסטים במודיעין לנטר כמויות אדירות של שיח מוקלט.

בתוכניתה של סוכנות IARPA להעניק למשתתפים בתחרות ASpIRE כ-15 שעות של הקלטות שבוצעו על ידי מיקרופונים רבים כדי שיוכלו לכייל את התוכנות שלהם. במהלך שלב ההערכה, המשתתפים יקבלו 10 שעות של טקסט שמקורו במה שמכונה "נתונים ממיקרופון מרוחק", כלומר הקלטות בחדרים רועשים עם הד. סוכנות IARPA תבצע הערכה לגבי שיעור המשגים של הטכנולוגיות המשתתפות בהבנת ההקלטות.