This post is also available in: enEnglish (אנגלית)

התמודדות עם טקסטים משפות מיעוט נחשבה עד לאחרונה כמאתגרת בכל הנוגע לטכנולוגיות שונות של תרגום ואחזור, בשל היקף המידע המצומצם והשימוש שעשו בו מערכות האימון האוטומטיות.

טכנולוגיית אחזור המידע החדשה בין שפות של חברת ריית'און (Raytheon) האמריקנית מאפשרת לדוברי אנגלית לחפש טקסט ולנתח קטעי דיבור בשפה זרה, ולקבל סיכומים רלוונטיים מתורגמים לשפה האנגלית, משפות שונות וגם משפות מיעוט. התוכנה מאפשרת אחזור מידע בצורת טקסט או דיבור לצד תרגום של ביטויים רלבנטיים, ותורמת להבנת ההקשר ומשמעות התוכן מנקודת מבטו של הדובר הילידי.

לפי stripes.com, הכלי החדשני שפיתחה חברת הטכנולוגיה מאפשר לחפש בטקסטים ובקטעי דיבור משפות שונות באמצעות מילות חיפוש באנגלית. פיתוח הכלי ארך כארבע שנים, והוא נוצר כחלק מתוכנית ה-IAPRA MATERIAL (Machine Translation for English Retrieval of Information in Any Language – תרגום מכונה לאנגלית תוך אחזור מידע מכל שפה).

הכלי החדש מאפשר אחזור מסמכים והקלטות בשפות זרות לשאילתה באנגלית, ומספק למשתמש תרגום ייעודי של ביטויים רלבנטיים. כך המשתמש יכול להבין את ההקשר והמשמעות, מבלי שילמד את השפה. המערכת בחנה את השפות קזחית, פשטו, סומלי, סווהילי וטאגלוג כדי להוכיח את יעילותה גם כשמדובר בשפות שיש לגביהן משאבים מוגבלים בכל הנוגע ללמידה מכונה, כמו שפות מיעוט. נוסף על כך, נבדקו גם השפות פארסי, בולגרית, ליטאית וגאורגית.