This post is also available in:
מודלי שפה כמו ChatGPT של OpenAI צברו פופולריות בשל יכולתם לעבד כמויות עצומות של מידע וליצור טקסט שדומה לכזה שנכתב על ידי בן אדם. עם זאת, הדרישות החישוביות שלהם הגבילו לעתים קרובות את השימוש בהם למחשבים ושרתים רבי עוצמה. על כן, הצורך ההולך וגדל בכלי AI נגישים ויעילים יותר במכשירים ניידים הוביל את החוקרים לחקור גרסאות קטנות ויעילות יותר של מודלים אלה.
צוות מ- Beijing University of Posts and Telecommunicationsהציג את PhoneLM, מודל שפה קטנה (SLM) חדש שנועד להביא את הכוח של LLM ישירות לטלפונים חכמים. PhoneLM, אשר המידע על אודותיו פורסם לאחרונה במאמר באתר arXiv, שואף למטב את יעילות זמן ההרצה מבלי לפגוע בביצועים, על פי TechXplore. פריצת דרך זו יכולה להפוך פלטפורמות כמו ChatGPT לנגישות יותר לשימוש יומיומי בטלפונים חכמים, ולספק למשתמשים אינטראקציות מהירות ויעילות יותר עם בינה מלאכותית.
החידוש העיקרי של PhoneLM טמון בתהליך העיצוב שלו. שלא כמו LLM מסורתיים, אשר בדרך כלל מאומנים מראש עבור דיוק לפני אופטימיזציה, PhoneLM נוקטת בגישה חדשה על ידי מתן עדיפות ליעילות ברמת הארכיטקטורה. הכותב הבכיר של המאמר מנגווי שו הסביר כי הצוות התמקד בזיהוי תצורות ספציפיות לחומרה – כגון רוחב ועומק של דגם – אשר ימקסמו את הביצועים במכשירים ניידים לפני תחילת האימון. גישה זו היא המפתח ליכולת של המודל לפעול ביעילות על טלפונים חכמים.
בבדיקות ראשוניות, PhoneLM הגיע לביצועים מרשימים, והציע שיפורים במהירות לעומת LLM בגודל דומה, מבלי להקריב את יכולות עיבוד השפה הטבעית (NLP) שלו. שו ועמיתיו מצאו כי אופטימיזציה של הארכיטקטורה של המודל הייתה בעלת השפעה משמעותית יותר על יעילות זמן הריצה מאשר התמקדות בדיוק בלבד.
הצוות הפך את עבודתם לציבורית על ידי שחרור הקוד והדגמה של PhoneLM פועל על מכשירי אנדרואיד. מהלך זה פותח את הדלת להתפתחויות עתידיות, כולל גרסאות מתקדמות יותר של PhoneLM ויישומים פוטנציאליים בעוזרים וירטואליים ניידים המופעלים על ידי LLM במכשיר.
בזמן שהבינה המלאכותית הניידת ממשיכה להתפתח, PhoneLM מייצג צעד משמעותי קדימה בהבאת היכולות של LLM לסמארטפונים, מה שהופך מודלי שפה מתקדמים לנגישים יותר, מהירים יותר וחסכוניים באנרגיה עבור משתמשים רגילים.


























