מודל בינה מלאכותית ממיר תיאור קולי לתמונות מדויקות של מקומות גיאוגרפים

Dec 3, 2024

This post is also available in: English (אנגלית)

חוקרים מאוניברסיטת טקסס באוסטין פיתחו שיטה פורצת דרך המשתמשת בבינה מלאכותית גנראטיבית כדי להמיר צלילים מהקלטות אודיו לתמונות רחוב. המחקר שלהם, שפורסם בכתב העת Computers, Environment and Urban Systems, מראה כי בינה מלאכותית יכולה לשכפל את היכולת האנושית לחבר תפיסות קוליות ו-ויזואליות של הסביבה, ולספק ייצוג חזותי חי מצלילים בלבד.

על פי TechXplore, הצוות הכשיר מודל AI על ידי הצמדת קטעי אודיו עם תמונות מקבילות של סביבות רחוב עירוניות וכפריות ברחבי צפון אמריקה, אסיה ואירופה. מערכי נתונים אלה, שכללו דגימות אודיו של 10 שניות ותמונות סטילס של מיקומים שונים, אפשרו לבינה המלאכותית ללמוד כיצד מידע קולי מכיל רמזים חזותיים. על ידי הזנת קלט אודיו חדש למודל, הוא יכול היה ליצור תמונות ברזולוציה גבוהה שתואמות באופן מדוייק לסצנות בעולם האמיתי.

יוהאו קאנג, עוזר פרופסור לגיאוגרפיה ומחבר משותף של המחקר הסביר: "המחקר שלנו מצא כי סביבות אקוסטיות מכילות מספיק רמזים חזותיים כדי ליצור תמונות רחוב מוכרות מאוד המתארות במדויק מקומות שונים". התוצאות היו מרשימות, עם תמונות שנוצרו על ידי AI המציגות התאמה חזקה עם תמונות מהעולם האמיתי. המשתתפים האנושיים הצליחו להתאים נכונה 80% של התמונות שנוצרו עם דגימות השמע המתאימות שלהם, מה שאימת עוד יותר את הדיוק של מודל הבינה המלאכותית.

לא זו בלבד שהבינה המלאכותית שיכפלה את הפרופורציות של בניינים, שמיים וצמחייה, אלא שהיא גם קלטה פרטים עדינים כמו סגנונות אדריכליים, מרחקי עצמים ותנאי תאורה. המחקר גם הדגיש כיצד צלילים מסוימים, כמו צלילי מכוניות או ציוצי חרקים ליליים, יכולים לחשוף מידע לגבי הזמן ביום, ולהוסיף עומק ליכולת של הבינה המלאכותית לדמות תנאים סביבתיים.

קאנג, שמחקריו מתמקדים בהצטלבות של בינה מלאכותית גיאו-מרחבית ואינטראקציה בין בני אדם לסביבה, הדגיש את הפוטנציאל שבינה מלאכותית תגיע מעבר לזיהוי הסביבה הפיזית ותעשיר את ההבנה שלנו לגבי האופן שבו אנו חווים מקומות באופן סובייקטיבי. עבודה זו מצביעה על כך שמכונות עשויות להציע יום אחד גישה רב-חושית לפרשנות סביבה, המגשרת על הפער בין מה שאנו שומעים לבין מה שאנו רואים.

מודל בינה מלאכותית ממיר תיאור קולי לתמונות מדויקות של מקומות גיאוגרפים

כתבות אחרונות

DJI תישאר ברשימת המעקב של צבא ארה"ב בשל חששות משימוש דואלי...

מיקרוסופט בוחנת שימוש בנוזל תוך-שבבי לקירור וייעול מרכזי הנתונים

נערים נעצרו בהולנד לאחר שנתפסו עם ציוד ריגול סמוך למוסדות אכיפת...

מחקר חדש סולל את הדרך לייצור דלקים סולאריים יעילים יותר מבוססי...

אנתרופיק משיקה את קלוד 4.5

מחקר מגלה: עכברים ובינה מלאכותית לומדים לשתף פעולה בדרכים דומות

סין ממירה מטוסי קרב ישנים למל"טים חמושים

חשד למתקפת סייבר על תשתיות לוויין ישראליות

מחקר חדש מגלה: כמעט לא ניתן להבחין בין קול המיוצר ע"י...

מערכת חדשה מבוססת בינה מלאכותית משפרת את הגילוי ארוך הטווח של...

חקירה מגלה: טיקטוק אוספת מידע אישי ממשתמשים קטינים

מחקר חדש חושף כיצד גם פקודות מוצפנות לרובוטים עלולות לדלוף מידע...

חומרי דחף תרמופלסטיים מודפסים בתלת־ממד ישמשו במנועים רקטיים מוצקים

נעשה שימוש ב-GitHub להפצת נוזקה למשתמשי Mac

מסגרת חדשה משפרת את קבלת ההחלטות של בינה מלאכותית בתרחישי חירום

רחפן חדש נמנע מפגיעות בהשראת ציפור הנקר

יוזמה עולמית קוראת להסכם בינלאומי על "קווים אדומים" בבינה מלאכותית עד...

שיתוף פעולה בין אדם לבינה מלאכותית נבחן לשיפור קבלת החלטות בשדה...

פרויקט חדש שואף לפתור את אתגר החומרים במנועי דטונציה סיבובית

תוכניות האיחוד האירופי להקלת כללי הסכמת איסוף עוגיות מעוררות חשש לפגיעה...