בפשטות,
חברה סינית (אשר מופעלת ע"י קרן הון סיכון אם הבנתי נכון) פיתחה מודל אשר מציג ביצועים אשר לא יורדים מהמודלים הטובים ביותר.
היא מנגישה אותו לציבור בחינם (בניגוד למקבילות המערביות) + היא הוציאה אותו כקוד פתוח (בניגוד למקבילות המערביות).
הם טוענים שהם מצאו שיטה לאמן את המודל עם כמות משאבים נמוכה משמעותית מהמקבילות המערביות ע"י חוזי של המידע.
לכן, הם בעצם לא דורשים מימון רב.
איפה הקאצ'ים?
א. זה אומר שהם יכולים לאמן מודלים חדשים מהר יותר ובעלות נמוכה יותר מהמערב, ובכך לייצר מודלים טובים יותר מהר יותר ('חומרי הגלם' זולים יותר)
ב. הם שוברים את המודל העסקי של המתחרות מהמערב, ע"י אלטרנטיבה חינמית.
ג. ע"י אימונים זולים יותר, אין צורך במעבדי GPU (אנבידיה וכו') בכמות שהאנליסטים חזו. ומכיוון שמדובר במכפילי ענק, כל תזוזה קטנה בביקוש מוכפלת במכפלות וכו'.
לגבי שאלה שמישהו שאל, הוספה של עוד משאבים לא תציג להם מודל טוב יותר. השיטה שהם המציאו בעצם מייתרת את הצורך להוספת משאבים יקרים.
יש להגיד שאני משתמש בהם כבר זמן מה לפני הבאזז. הם מייצרים אלטרנטיבה טובה למי שלא רוצה לשלם למקבילות / הצורך שלו לא דורש דברים 'אמיתיים'.
הם לא טובים באותה רמה כמו המודלים המערביים (לפחות בתחום העיסוק שלי, על בסיס ניסיון אישי שלי).