עלות הבינה המלאכותית של דיפסיק מוערכת להיות גבוהה בהרבה ממה שהחברה טוענת

Image by Unsplash

This post is also available in: English (אנגלית)

סטארט-אפ הבינה המלאכותית הסיני העולה במהירות DeepSeek גורם למהומה בעולם הטכנולוגיה. החברה השיקה לאחרונה את דגמי ה-V3 וה-R1 שלה, שמטרתם לגבור על שחקנים גלובליים מובילים כמו OpenAI. בעוד ש-DeepSeek מתגאה בעלות נמוכה יחסית של אימון מודל V3 שלה, אשר החברה טוענת שהיא רק 5.6 מיליון דולר, מבט מעמיק יותר על המספרים מצייר תמונה מורכבת יותר.

בדו"ח של Semianalysis, מוסבר כי הסכום של 5.6 מיליון דולר הוא רק עלות ההכשרה מראש – לא כולל מחקר, תחזוקה, תפעול וחומרה. DeepSeek גם חולקת את משאבי המחשוב שלה עם חברת האם שלה, High-Flyer, קרן גידור שהשקיעה מעל 500 מיליון דולר ב-GPUs של אנבידיה בלבד. העלות הכוללת של תשתית השרתים של DeepSeek מוערכת בכ-1.6 מיליארד דולר, עם 944 מיליון דולר נוספים שהושקעו בהפעלת חוות השרתים. בנוסף להערכה חדשה זו, שעולה בהרבה על ההצהרות הראשוניות של החברה, נחשף לאחרונה כי OpenAI טוענת כי DeepSeek השתמשה באופן בלתי חוקי בנתונים שלה כדי להכשיר את מודל הבינה המלאכותית שלה.

לכן, בעוד שהמספרים של DeepSeek עשויים להיראות טוב על הנייר, ההוצאות האמיתיות מספרות סיפור אחר – במיוחד כאשר לוקחים בחשבון את מלוא היקף הפיתוח. נראה כי החברה גם שוכרת עובדים רק מאוניברסיטאות בסין, ועל פי דיווחים מציעה משכורות של עד 1.3 מיליון דולר בשנה לכישרונות הטובים ביותר. עם 150 עובדים בלבד, דיפסיק פועלת עם צוות רזה אך יעיל מאוד. יתרון נוסף של DeepSeek נמצא במרכזי הנתונים הפנימיים של החברה, המאפשרים ניסויים זריזים יותר ואיטרציה מהירה יותר, משום שאין הסתמכות על ספקים חיצוניים.

בסופו של דבר, בעוד שהמודלים של דיפסיק מרשימים, הם לא בהכרח מנצחים מודלים אחרים בשוק, במיוחד את מודל O3 האחרון של OpenAI. הפיתוח המהיר של דיפסיק ועלויות התפעול הנמוכות יותר יוצרים סיפור מרתק, אבל כשמסתכלים מתחת לפני השטח, נראה שהתמונה המלאה מורכבת יותר ממה שטוענת החברה.