כיצד רשתות עצביות רואות?

כיצד רשתות עצביות רואות?

This post is also available in: enEnglish (אנגלית)

ראייה והבנה של דימויים ויזואליים כבר אינן מנת חלקן הבלעדית של יצורים ביולוגים. בשנים האחרונות הפכו מחשבים לטובים בצורה מעוררת השתאות בהבנה של מה שהם רואים. מיקרוסופט וגוגל שתיהן הציגו מערכות בשנה שעברה אשר טובות הרבה יותר בזיהוי אובייקטים בתמונות מאשר בני אדם, כך מדווח MIT Technology Review.

מאחורי ההצלחות הללו עומדת טכניקה אשר נקראת "למידה עמוקה, אשר כרוכה בהעברת מידע דרך רשתות של חיקוי של עצבים לצורך סינון של מידע עתידי." בלמידה עמוקה, המערכות העצביות מסודרות בשכבות היררכיות. מידע עובר דרכם בסדר מסוים, וכל שכבה "לומדת", או מתמחה בסוג מסוים של אופן עיבוד, על מנת לזהות מאפיינים ויזואלים מסוימים.

רשתות מלאכותיות מורכבות (Convolutional nets), הרשתות הנוירולוגיות אשר משמשות לעיבוד מידע ויזואלי, נוצרו מתוך השראת מחקרים על המבנים הנוירולוגיים בשכבה (קורטקס) הויזואלית של חיות, והן למעשה ניסיון לחיקוי שלהן.

"הרשתות הללו הן קפיצה עצומה לעומת שיטות ראייה ממוחשבות מסורתיות, היות והן לומדות היישר מתוך המידע אשר מוזן לתוכן," אומר מתיו זילר, מנכ"ל חברת Clarifai, ספקית שירותי זיהוי תמונה.

בעבר היו צריכים מתכנתים להמציא את האלגוריתמים אשר יחפשו מאפיינים ויזואלים בתמונות. אך התוצאות שהפיקה שיטה זו לא היו טובות דיין.

התוכנה של זילר, המבוססת על שיטות שפיתח כאשר היה סטודנט מתקדם באוניברסיטת ניו-יורק, עברו על מיליוני תמונות על מנת לאמן את הרשת. התוכנה אמונה על זיהוי אובייקטים מובחנים, מספלים למכוניות לבניינים. מאפיינים שונים בתמונות מעוררים שכבות שונות של הרשתות העצביות, שבתורן אוכפות את תפקידה של הרשת לזהות את המאפיין המסוים הזה. בפועל, ככל שהמערכת עוברת על יותר תמונות במאגר, כך היא לומדת לעשות את עבודתה טוב יותר.