מערכת בינה מלאכותית פורצת דרך יכולה לזהות דיאלקטים של ערבית בדיוק גבוה

Image by Unsplash

This post is also available in: English (אנגלית)

חוקרים מאוניברסיטת שארג'ה חשפו מערכת בינה מלאכותית פורצת דרך המסוגלת לזהות ניבים בערבית באופן אוטומטי, ובכך מסמנת התקדמות משמעותית בטכנולוגיית השפה. עבודה חדשנית זו, שפורסמה לאחרונה ב-IEEE Xplore, נועדה לפשט את המורכבות של ניבים ערביים לאור העובדה שמערכות זיהוי קול מסורתיות מתקשות לעתים קרובות לפרש אותם במדויק.

ערבית מדוברת ברחבי מדינות רבות ויש לה ניבים אזוריים רבים ושונים – כל אחד עם הגייה ייחודית ואוצר מילים משלו. מגוון זה מציב אתגרים מיוחדים לטכנולוגיה, במיוחד בהתחשב במאפיינים הפונטיים הייחודיים שלה. המערכת שפותחה על ידי החוקרים יכולה לזהות באופן אוטומטי איזה ניב ערבי מישהו מדבר, וזה הישג טכנולוגי מדהים.

על פי TechXplore, צוות המחקר עמד בפני אתגר עצום בהכשרת מחשבים לזהות ניבים שונים אך ורק על ידי ניתוח מילים מדוברות. הפיתוח של מודל למידת מכונה שיכול להבדיל במדויק בין מגוון רחב של ניבים ערביים מהקלטות שמע נדרש להתגבר הן על המורכבות המובנית של הניבים והן על הקשיים הטכניים של עיבוד אודיו. החוקרים השתמשו במאגר מידע נרחב של מעל 3,000 שעות אודיו, שנאסף מפלטפורמות כמו יוטיוב, הכולל 19 ניבים מדוברים במדינות שונות, החל מסוריה ולבנון וכלה בערב הסעודית ומרוקו.

באופן מרשים, מודל הבינה המלאכותית השיג שיעורי דיוק גבוהים, וזיהה נכון ניבים אזוריים 97.29% מהזמן וניבים ספציפיים של מדינה 94.92% מהזמן. "למרבה הפלא, השגנו זאת באמצעות 29% בלבד מנתוני ההכשרה הנדרשים בדרך כלל על ידי חוקרים אחרים", ציין פרופ' אשרף אלנגר, פרופסור למדעי המחשב ומערכות מודיעין. הצוות הפך את המודלים שלהם לנגישים לציבור בפלטפורמת HuggingFace, ועודד חוקרים אחרים למנף את עבודתם לשיפור טכנולוגיות בשפה הערבית.

היישומים הפוטנציאליים של מערכת AI זו הם עצומים, וסוללים את הדרך לחידושים עתידיים בזיהוי קול. הצוות ציין כי יש עניין בתעשייה בעבודתם, תוך אזכור הפוטנציאל שלה לאימוץ נרחב ביישומי שפה מונחי AI. עם הדיוק הגבוה ודרישות הנתונים הנמוכות של הפרויקט, המערכת בולטת ככלי נגיש לשיפור יכולות עיבוד השפה הערבית, ומושכת עניין מענקי טכנולוגיה כמו מיקרוסופט וגופים ממשלתיים בשרג'ה.