טכנולוגיות בינה מלאכותית חדשות מחוללות מהפכה בעולם הדיבור הסינתטי

טכנולוגיות בינה מלאכותית חדשות מחוללות מהפכה בעולם הדיבור הסינתטי

image provided by pixabay

This post is also available in: enEnglish (אנגלית)

ההתפתחויות בטכנולוגיית זיהוי הדיבור מ-IBM ומאוניברסיטאות בקליפורניה מציעות תקווה לחולים הסובלים מאובדן דיבור ושיתוק קולי.

IBM דיווחה שיצרה שבב מחשב מהיר ויעיל יותר באנרגיה, המסוגל לייצר מודל זיהוי דיבור בטעינה טורבו. עם הצמיחה המהירה של מודלים בשפה גדולה לפרויקטים של בינה מלאכותית, התחילו לעלות למודעות המגבלות של ביצועי החומרה שהובילו לתקופות אימון ארוכות יותר וצריכת אנרגיה מסתחררת.

חוקרי IBM המחפשים פתרון אומרים שהאבטיפוס שלהם משלב התקני זיכרון לשינוי פאזה בתוך השבב, וממטב תהליכי בינה מלאכותית בסיסיים הידועים כפעולות ריבוי-הצטברות (MAC) שמאיצות מאוד את פעילות השבבים. פעולה זו עוקפת את שגרת הזמן והאנרגיה הסטנדרטית של העברת נתונים בין זיכרון למעבד.

בפעולות זיהוי דיבור בעיבוד אינטנסיבי, אב הטיפוס של IBM השיג 12.4 טריליון פעולות לשנייה לוואט, רמת יעילות של עד מאות פעמים טובה יותר מאשר המעבדים החזקים ביותר הנמצאים בשימוש כיום.

בינתיים, חוקרים באוניברסיטת קליפורניה בסן פרנסיסקו ובאוניברסיטת ברקלי אומרים שהם המציאו ממשק מוח-מחשב לאנשים שאיבדו את היכולת לדבר שמייצר מילים בהתבסס על המחשבות והנסיונות להפיק מילים של המשתמש. אדוארד צ'אנג, יו"ר המחלקה לכירורגיה נוירולוגית באוניברסיטת קליפורניה בסן פרנסיסקו אמר כי המטרה שלהם היא לשחזר "דרך מלאה ומגולמת של תקשורת, שהיא הדרך הטבעית ביותר עבורנו לדבר עם אחרים".

לפי Techxplore, צ'אנג וצוותו השתילו שני חיישנים זעירים על פני מוחה של אישה הסובלת מ-ALS (מחלה נוירוגנרטיבית שגורמת לאדם לאבד בהדרגה את הניידות ואת הדיבור שלו). החיישנים היו מחוברים באמצעות ממשק מוח-מחשב לבנקים של מחשבים עליהם הייתה תוכנת פענוח שפה.

האישה עברה 25 אימונים בהם היא קראה סטים של כמה מאות משפטים ופעילותה המוחית תורגמה על ידי המפענח, אשר זיהה פונמות והרכיב אותן למילים. החוקרים סינתזו את הדיבור שלה בהתבסס על הקלטה של נאום שנשאה בחתונה שנים קודם לכן, ואף עיצבו אווטאר ששיקף את תנועות הפנים שלה.

לאחר ארבעה חודשים של אימונים, המודל היה מסוגל לעקוב אחר ניסיונות הקולות של האישה ולהמיר אותם למילים מובנות, וכאשר התבסס על אוצר מילים של 125,000 מילים, שיעור הדיוק היה 76%. המערכת גם הצליחה לתרגם את דיבור האישה בקצב של 62 מילים לדקה, אך למרות שזהו שיפור עצום מניסויים קודמים זה עדיין רחוק משיעור הדיבור הטבעי של 160 מילים לדקה.

לסיכום, למרות שעדיין לא מדובר במכשיר שאנשים יכולים להשתמש בו בחיים האמיתיים, ההוכחה המדעית הזו היא צעד משמעותי מאוד לקראת עולם בו אנשים עם שיתוק יוכלו לדבר שוב.