מקום אחד לכל מה שתצטרכו: כך פלטפורמת דאגסהאב משנה את המשחק עבור מפתחי בינה מלאכותית

This post is also available in: English (אנגלית)

בינה מלאכותית כובשת את העולם בסערה, ובצדק: היא בעלת פוטנציאל אדיר לייצר פיתוחים פורצי דרך. אך הפיכת רעיון למודל מבטיח היא לרוב מסע ארוך, מקוטע ובלתי צפוי. החל מנתונים מפוזרים ועד שיטות עבודה מנותקות וקשיי שכפול, מפתחי בינה מלאכותית עומדים כיום בפני אתגרים שמפחתי תוכנה רגילים כבר פתרו מזמן, או כאלה שהם לא היו צריכים להתמודד איתם מראש. ועבור ארגונים רבים, במיוחד אלה המטפלים במידע מסווג או רגיש, הסיכונים והמורכבויות גדולים אף יותר.

כאן דאגסהאב נכנסת לתמונה.

דאגסהאב (DagsHub) היא פלטפורמה שמלווה צוותי מחקר ופיתוח של בינה מלאכותית מקצה לקצה ומרכזת את כלל הכלים ושיטות העבודה למקום אחד ויחיד. כך, היא מאיצה באופן דרמטי את פיתוח המודל בשלושה תחומים מרכזיים: הפיכת חומר גולמי למערכי נתונים מובנים, מעקב אחר ניסויים וניהול ושיתוף של דאטה ומודלים.

יצירת מערכי נתונים מתוך החומר הגולמי

דאגסהאב מתחילה בהפיכת דאטה מולטי-מודאלי בלתי מובנה (unstructured or multimodal data) למערכי נתונים מובנים (structured datasets). המערכת מתחברת ישירות למקום שבו החומר כבר מאוחסן, בונה טבלאות מועשרות, ותומכת הן בתיוג ידני והן בתיוג באמצעות מודלי בינה מלאכותית (AI). כך, היא מקלה על יצירת מערכי נתונים מוכנים לאימון מתוך כמות אדירה של חומר, ומכינה את הקרקע לאימון מודל טוב יותר.


מעקב אחר ניסויים

לצורך אימון המודל, דאגסהאב יכולה להשתלב עם פלטפורמות אימון כגון Run:AI, OpenShift AI או AWS SageMaker. כך, משתמשים יכולים להעביר את מערכי הנתונים החדשים שלהם לפלטפורמת האימון המועדפת עליהם באמצעות שתי שורות קוד בלבד. לאחר כל ניסוי, ניתן לדווח את התוצאות למערכת של דאגסהאב, שיכולה לעקוב אחר ניסויים ולתעד פרמטרים, מטריקות, משקולות של המודל המאומן, וארטיפקטים אחרים הנחוצים להבנת מהלך הניסוי. יכולת זו מאפשרת למשתמשים להבין טוב יותר מה עבד, ומה לא עבד, בכל ניסוי, ולמה.

ניהול ושיתוף דאטה ומודלים

בעיה נפוצה אחת בארגונים גדולים היא קיומם של מספר צוותים העובדים באופן לא מודע על פרויקטים דומים של בינה מלאכותית במקביל. שכפול מאמצים זה לא רק מבזבז זמן ומשאבים יקרי ערך, אלא גם מוביל לתוצאות לא עקביות. דאגסהאב פותרת בעיה זו על ידי יצירת "קטלוג דיגיטלי" של מודלי הבינה המלאכותית ומערכי הנתונים הקיימים בארגון, הזמין לצוותים השונים בהתבסס על הרשאות משתמש ורמות סיווג. בנוסף, הפלטפורמה תומכת בניהול גרסאות מרובות של אותו מודל, מה שמקל על התאמת מודלים לשימושים או לקוחות שונים.

פריסה מבודלת

ניתן לפרוס את המערכת על הענן או על גבי שרתי החברה, אך מה שהופך את דאגסהאב לכלי חזק עוד יותר הוא התמיכה שלה בפריסה מאובטחת. ניתן להתקין את הפלטפורמה על מערכות מבודדות (air-gapped) ועל גבי סביבות OpenShift של Red Hat, מה שהופך אותה לאידיאלית עבור ארגונים העובדים עם נתונים מסווגים או רגישים – כמו סוכנויות ממשלתיות או גופים ביטחוניים.

נוחות שימוש וניידות

בנוסף לכל זה, המערכת גם אינטואיטיבית ביותר. כל הפורמטים המהותיים במערכת מבוססים על כלי קוד פתוח, כך שמשתמשים לא צריכים ללמוד מערכת חדשה לחלוטין. במקום, הם יכולים להמשיך לעבוד עם הכלים שהם כבר מכירים – כגון Git לניהול קוד, DVC לניהול גרסאות נתונים, MLflow למעקב אחר ניסויים וניהול מודלים, ו-Label Studio לתיוג הדאטה. גישה זו מקלה משמעותית על אימוץ המערכת חדשה, מבטיחה התאמה לשיטות עבודה קיימות ומאפשרת לצוותים לפעול במהירות מבלי להתפשר על גמישות או שליטה.

הצוות

דאגסהאב נוסדה בשנת 2020 על ידי דין פלבן (מנכ"ל) וגיא סמוילובסקי (CTO), חברי ילדות עם רקע טכנולוגי. דין, שלמד פיזיקה ומדעי המחשב ועסק במחשוב קוונטי, וגיא, יוצא יחידת עילית טכנולוגית עם ניסיון ב-backend, ML, והנדסת נתונים, זיהו פער ברור: לצוותי תוכנה יש כלים עוצמתיים לניהול קוד, אבל לצוותי  AI היו רק מערכות מנותקות ומפוזרות. דאגסהאב הייתה התשובה שלהם – פלטפורמה מאוחדת לפיתוח בינה מלאכותית מודרני.

כיום, עם יותר מ-50,000 משתמשים ולקוחות, כולל ארגונים ברמת אבטחה גבוהה, דאגסהאב מוכיחה שהכלים הנכונים יכולים להפוך פוטנציאל למציאות.

 

 חברת דאגסהאב הינה בוגרת מרכז החדשנות INNOFENSE (אינופנס) שמפעילה iHLS בשיתוף עם משרד הביטחון. תוכנית האצה ייחודית זו מסירה עבור יזמים את החסמים לאקוסיסטם הטכנולוגי, והופכת אותם לחברות בשלות ומובילות תוך חיבור למשקיעים הנכונים ומובילה למיזמים טכנולוגיים דואליים במגזרים האזרחי והביטחוני. מטרת התוכנית היא חיזוק הקשר בין השוק האזרחי והשוק הביטחוני באמצעות פיתוח משותף של הטכנולוגיות, ובכך לקדם ולשפר את הטמעתן בשני השווקים.