כשמשה תנ"ך, מנכ"ל ומייסד חברת שבבי הבינה המלאכותית (AI) ניוריאליטי מציג לראשונה את האבטיפוס של השבב החדש שהשיקה היום החברה, הוא נדרש לסיפור שאירע אי שם בהיסטוריה הקרובה-רחוקה של עולם הטכנולוגיה. זה היה ב-2012, כשגוגל החלה להבחין שהתשתיות שלה לא עומדות בעומס שייצרו שירותי החיפוש שלה ושירותי הזיהוי הקולי שלה, בהמרת קול לטקסט. השירותים החינמיים הללו קרעו את תשתית החומרה שלה וייצרו עלויות מיותרות.
כדי להתגבר על כך, ביקשה גוגל לתכנן שבב חדש שיותאם לצרכים של משימות בינה מלאכותית מסוג של "למידה עמוקה". אנשי גוגל, כך הוא מספר, החלו לחפש פיתרון בדמות שבב חדש שיטפל בשירותים מבוססי הבינה המלאכותית טוב יותר מהמעבדים המרכזיים (CPU), שלא עוצבו באופן שמאפשר להם לעבד המון פעולות קטנות במקביל.
"הם ראו שהמעבד המרכזי לא עומד בזה. אני הייתי באינטל כשהם אמרו לנו שהם צריכים רכיב ללמידה עמוקה. אנחנו בתגובה שאלנו שאלות כמו כמה ביזנס זה יכול לייצר, כמה תקנו וכו'". באינטל, כך נראה, לא ידעו איך לאכול את הבקשה, וגלגלו את גוגל חזרה הביתה: "גררנו רגליים עד שהם החליטו ליצור לבד את רכיב הבינה המלאכותית הראשון בעולם, והשאר היסטוריה. היום יש 1,500 מפתחים בתוך גוגל שעושים צ'יפים. פעם לא היה דבר כזה".
מי שניצלה את ההזדמנות וזכתה מן ההפקר היתה אנבידיה, שגילתה שבתוספת של שכבת תוכנה, היא מסוגלת להפוך את המאיצים הגרפיים שלה למעבדי בינה מלאכותית. זהו פיתרון גמיש אבל לא אופטימלי בהשוואה לשבבים שעוצבו מלכתחילה למשימות AI, אבל לאנבידיה זה הספיק כדי לפרוץ ראשונה לשוק.
כך החל התהליך שהפך את אנבידיה לשחקן המשמעותי ביותר כיום בשוק שבבי ה-AI. עד כמה משמעותי? השוק והאנליסטים מעריכים את הפוטנציאל שלה להשפיע על עתיד תשתיות האינטרנט עד שתימחרו אותה גבוה מאינטל, למרות שהיקפי המכירות שלה הם שבריר מהמכירות של ענקית השבבים.
במקביל, גוגל לא התייאשה והחלה לפתח שבבי בינה מלאכותית בעצמה, עבור עצמה. גם היא, כמו אמזון, כמו אפל, כמו פייסבוק, רוצה להשפיע על האופן שבו בנויים השבבים במוצרים שלהן, או בדאטה סנטרים שמהווים את התשתית שלהם, ושעל בסיסם יתרחשו המהפכות הטכנולוגיות הבאות, כמו ערים חכמות, רכב אוטונומי ועולמות תלת מימד וירטואליים.
תנ"ך מספר את הסיפור הזה, כי הוא מסכם בקצרה לא רק את הסיפור של ניוריאליטי, "מציאות חדשה" באנגלית, אלא של תעשיית השבבים בכלל, ואולי אפילו של כל תעשיית הטק. על פי תנ"ך, לאינטל היתה הזדמנות לא רק להוביל את תעשיית שבבי הבינה המלאכותית לפני אנבידיה, אלא גם לעשות את זה עם גוגל. למרבה הצער, הוא קובע, חברות גדולות נוטות להמשיך לעשות את מה שהן טובות בו ולא בהכרח יחפשו חדשנות שתייעל את כלל המערכת במקומות הנכונים.
הוא חבר ליוצאי כמה מן החברות בפרופיל הכי גבוה בתחום, שכמוהו, הבינו מצד אחד איך השוק בנוי, ומצד שני, איתרו את מה שלדעתם הוא צוואר בקבוק טכנולוגי באופן שבו מאורגנים הרכיבים השונים בתוך הדאטה סנטר. צוואר בקבוק כזה, שהתגברות עליו תוכל לספק לשוק ביצועים עדיפים במכפלות, תוך שהם מציעים פתרון שונה מזה שמציעות החברות המובילות. השבבים של ניוריאליטי, מסביר תנ"ך, לא נועדו לציוד הקצה, כמו למשל "מצלמות אבטחה שתלויות על עמוד חשמל", אבל הם כן מתאימים לצמתי מידע או דאטה סנטרים, בין אם בענן, או באנטנות (תחנות בסיס) סלולריות או בארונות התקשורת בפאתי שכונות המגורים.
אב הטיפוס של פלטפורמת ה- AI- centric של Neureality / צילום: ניוריאליטי
"לעומס יש משמעות כלכלית אדירה"
כמו לא מעט גורמים בשוק, מציין תנ"ך, הוא ושותפיו ראו את ההתמקדות של הענקיות ושל סטארט-אפים ביכולות העיבוד של השבבים. זו הסיבה שאינטל רכשה את הבאנה וזו הסיבה שגוגל מפתחת את שבבי ה-TPU שלה. תנ"ך וחבריו הבינו שחלק ניכר מצוואר הבקבוק לא נמצא במעבד, אלא בשער הכניסה אליו - במקום שבו מתקבלות ההחלטות לגבי השאלה איזה מידע להעביר לשבב ה-AI, ובאיזה סדר, תוך הפחתת עומסים מהמעבד המרכזי שבשרת.
"לעומס הזה יש משמעות כלכלית אדירה", מבהיר תנ"ך. "על כל דולר שאני משקיע במאיץ AI, אני מבזבז עוד שלושה דולרים על המערכת מסביב - על כרטיס הרשת (ניק), על המעבד המרכזי שעולה 7,000-10,000 דולר, ועל הסוויץ' שמחבר את המעבד המרכזי לארבעה או לשמונה מאיצי בינה מלאכותית". המחיר של שבבי ניוריאליטי יעמוד על סדר גודל של כ-1,500-3,000 דולר.
לדברי תנ"ך, זו בדיוק הסיבה שאנבידיה רכשה את מלאנוקס. זו הסיבה שסיסקו משקיעה ברכישת חברות טכנולוגיות חדשניות בתחום שבבי התקשורת, והסיבה שסטארט-אפ השבבים החדש של היזם הסדרתי אביגדור וילנץ, שכבר מכר חברות לאמזון ולאינטל - מתמחה גם הוא בתקשורת.
זו הסיבה, טוען תנ"ך, שאנבידיה אימצה את הגישה של חברת פאנג'בל, ומיתגה באחת ההשקות האחרונות שלה את שבבי התקשורת החדשים של מלאנוקס, כיחידה מסוג חדש - DPU (יחידת עיבוד לדאטה סנטר), שחוסכת עומס מהמעבד המרכזי, באופן שיידע לטפל במשימות עתירות דאטה.
לטענת תנ"ך, הגישה הזו היא "גם לא אופטימלית וגם יקרה" ובכלל לא צריך רכיב שכזה. "מה שאנחנו רוצים שיהיה בעתיד בדאטה סנטר הוא שכל רכיב (כמו אחסון או מאיץ של אנבידיה) שיחסוך עומס מהמעבד המרכזי, על יד כך שהוא יהיה מחובר לרשת בעצמו, ויהיה מבוסס על חומרה בלבד, בלי תלות בתוכנה, דבר שמכביד על המערכת באופן שמגביל את ביצועיה".
לייעל את המערכת במקום לייעל את המוח
השבב של ניוריאליטי מיועד לשלב ה-"יישום", אינפרנס, של משימות בינה מלאכותית. בלמידת מכונה קיימים שני שלבים - שלב האימון של המודלים, שבו מראים למערכת תמונות שונות, למשל, ומסבירים לה מה נמצא בכל תמונה. כך המכונה לומדת למצוא לבד את החוקיות שקובעת מה זה מה באופן שיאפשר לה בהמשך, בשלב היישום, לראות תמונה חדשה, ולהבין לבד מה מצולם בה.
כשאנו מעלים תמונה לפייסבוק, המכונה כבר מציעה לנו תיוג אוטומטי. תיוג זה התאפשר לאחר שהמכונה למדה בעבר לזהות אותנו, בין היתר משום שבעבר כבר סייענו לה, בכך שתייגנו את עצמו בתמונות חדשות שהעלנו.
שלב האימון הוא השלב שמעניין חוקרים ברמה הגבוהה ביותר, באקדמיה או בתעשייה. זהו שלב חשוב שהתעשייה מתמקדת עדיין כיצד לבצע באופן איכותי מהיר וזול, אבל לא בו נמצא הכסף הגדול. "כל פעם שאתה מעלה לפייסבוק תמונה שצילמת באיזה טיול, מיד מתבצעת עליה פעולת קיטלוג וניבוי, מפרט תנ"ך, "כשאנחנו גוללים את הפיד, יש מנוע מאחורה שכל הזמן אומר מה הדבר הבא שנכון להראות לי, שישאיר אותי מול המסך. פייסבוק עושה 300 טריליון 'פרדיקציות' כאלה במערכת ההמלצות שלה מדי יום ביומו ואת העיבוד הזה החברות הללו רוצות להוזיל".
אל בעיית ניצול האנרגיה ניגשו תנ"ך וחבריו מכיוון אחר. במקום לייעל את המוח - את שבב ה-AI, הם מבקשים לייעל את כל המערכת שסביבו. שבב חדש, שיוצב במיקום חדש, במערך הרכיבים של הדאטה סנטר.
הרכיב החדש, שאב הטיפוס הראשון שלו הושק היום, מציע שלוש טכנולוגיות לניתוב חכם של המידע הנכנס למעבד הבינה המלאכותית, בין הוא מעבד של אנבידיה או של הבאנה, באופן שיכול לסחוט ממנו ביצועים גבוהים פי עשרה אם מצמידים אותו למאיץ מבחוץ, או פי 50 - אם מכניסים את החידושים שלו אל תוך המאיץ פנימה.
"אנחנו מדברים עם גוגל"
בינתיים השבבים של ניוריאליטי נמצאים אצל כמה לקוחות למטרות בחינה וניסוי. פיזית, בעולם האמיתי, הם נראים כמו מחסניות פלסטיק שחורות בגודל של ספר. 16 יחידות שכאלה מאכלסות מגרה אחת שנכנסת לארון בדאטה סנטר.
הרעיון הוא שלכל יחידה של מאיץ בינה מלאכותית בדאטה סנטר, של אנבידיה או הבאנה למשל, תוצמד יחידה של שבב של ניוריאליטי, שייעל את זרימת המידע אל תוך השבב וכך יסחט ממנו עוד ועוד ביצועים. "ניוריאליטי היא כש-AI פוגש סקייל (גידול משמעותי בהיקפי השימוש)", אומר תנ"ך.
"אנחנו מדברים עם גוגל, וגוגל יוכלו לקנות את הטכנולוגיה. אנחנו לא נמכור IP, הם יוכלו לקנות את החברה ולהטמיע אותה בשבבי ה-TPU שלהם ולייעל אותם".
מדוע הדבר לא נעשה עד כה? התשובה של תנ"ך מדברת על כשל שוק בסיסי והיעדר מוטיבציה של הענקיות, כפי שאירע בדוגמה על אינטל וגוגל בפתיחת הכתבה. "כולם מדברים על חדשנות ברמת המערכת, אבל אף אחד עוד לא עשה את זה כי אינטל ו-AMD רוצים להמשיך למכור CPU", הוא טוען, "ברודקום ומלאנוקס - רוצים למכור ניקים, ואנבידיה רוצה למכור את המאיץ שלה. רק סטארט-אפ יכול לבוא ולומר - 'לא מעניין אותנו הארכיטקטורה שלכם ששמה את ה-CPU במרכז, ומסביבו את הניקים ומאיצי ה-AI', לטרוף את הקלפים ולהציע ארכיטקטורה אחרת מזו שהיתה נהוגה ב-20 השנים שבהן דווקא ה-AI במרכז".
את הארכיטקטורה המדויקת של השבב - כיצד החלקים הפנימיים השונים בו מאורגנים - תנ"ך חושש בהתחלה להציג כדי לא להסגיר אותה למתחרים. אבל עם זאת הוא רומז שהמבינים יוכלו לנחש את הגישה של ניוריאליטי על בסיס הרזומה של הנהלת החברה ויועציה.
ניוריאליטי נוסדה בשנת 2019 על ידי משה תנ"ך, המשמש כמנכ"ל, צביקה שמואלי, סגן נשיא לתפעול, ויוסי קסוס המשמש כסגן נשיא לפיתוח שבבים. לפני הקמת ניוריאליטי, תנך כיהן בתפקידים בכירים כמנהל הנדסה במארוול ובאינטל וסגן נשיא למו"פ בדיזיינארט נטוורקס (שנרכשה מאוחר יותר על ידי קוואלקום). צביקה שמואלי כיהן כסגן נשיא Backend במלאנוקס וכסגן נשיא להנדסה בהבאנה לאבס. יוסי קסוס שימש כדירקטור בכיר להנדסה במלאנוקס וכראש תחום פיתוח השבבים באיזיצ'יפ. יועצי החברה הם בעלי תפקידים בחברות המובילו בתחום בהן היילו, Vayyar, אינוביז, Arbe, וקבוצת הפיתוח של אינטל לבינה מלאכותית "נירוונה" שמוזגה להבאנה לאחר הרכישה.
צוות יזמי הסטארט-אפ Neureality / צילום: ניוריאליטי
השבב של ניוריאליטי שהושק היום הוא כאמור בשלב אבטיפוס ראשוני. לשם כך עשו מהנדסי החברה שימוש בשבבי FPGA של החברה המובילה בתחום "זילינקס", שמפתחת מעין שבב "לגו", שמאפשר למפתחי חומרה ליישם את התפיסות הארכיטקטוניות שלהם, מבלי לפתח את השבב מאפס. כך הם יכולים להוכיח את הביצועים שלו ואת היתכנות הקונספט שלו, לפני שהם פונים להתגבר על האתגרים שכרוכים בהליך הייצור. אתגר זה הוא אתגר חדשנות לא פשוט בפני עצמו, כפי שמלמדים העיכובים בייצור ב-10 וב-7 ננומטר שחוותה אינטל בשנים האחרונות.
"בקרוב חברות הטלקום יתחילו למכור גם שירותי עיבוד ואחסון"
בתחום הדאטה סנטרים, הלקוחות של שבבים כמו אלה של ניוריאליטי הן חברות הענן עצמן - אמזון, גוגל, מיקרוסופט וגם אורקל ויבמ, חברות טלקום, וחברות שמרכיבות שרתים.
לדעת תנ"ך זה לא מסתיים כאן, ועם הזמן יווצרו עוד שווקים למעבדי AI: "יהיה בקרוב שינוי גדול בתעשייה, כשחברות כמו אורנג', סלקום ובזק ירצו גם כן יכולות עיבוד AI. אנו רגילים לכך שחברות הטלקום מוכרות לנו שרותי תקשורת, אבל בקרוב הן יתחילו למכור גם שירותי עיבוד ואחסון, ולו בגלל שהממשלות לא יאפשרו לפייסבוק אמזון וגוגל להשתלט לגמרי על התחום. ואצל חברות הטלקום, הלחץ על עלות והספק אפילו עוד יותר גדול".
תנ"ך מספר על ארון תקשורת בכניסה לרחוב שלו שהוא עובר לידו כשהוא מטייל עם הכלב ושומע את המאווררים מתאמצים לקרר את הנתבים. "אם תשים שם גם שרת של הבאנה או אנבידיה אתה תשרוף את הארון, חייבים משהו הרבה יותר יעיל, וזה מה שאנחנו עושים".
כל השווקים של השרתים, מהענן ועד נקודות הגישה בשכונות המגורים, בלי יחידות הקצה, יגיעו לכ-73 מיליארד דולר עד 2025 על פי נתוני טרקטיקה. מתוכם, היקף שוק מעבדי ה-AI לבדו צפוי לעמוד על 19 מיליארד דולר. "כשיש לך שוק כל כך ענק, מותר לך לשנות מבנה מערכת ושיטות, כי יש מספיק צורך לקנות מוצרים חדשניים שמקפיצים בסדר גודל", מדגיש תנ"ך.
"אם אלקסה של אמזון רצה על מאה אלף שרתים, ומבצעת מאות מיליוני פעולות ביום, העלות של האפליקציה כל כך גבוהה שהם יהיו מוכנים להטמיע כל טכנולוגיה שתאפשר להם לקפוץ בסדר גודל. הבעיה היא שכל שנה כמות הלמידה העמוקה שמעובדת מוכפלת, אבל זה לא הגיוני להכפיל כל שנה את כמות הדאטה סנטרים. אז כל שנה הם רוצים להטמיע מעבדים יותר חזקים. אבל המעבד של אינטל לא קופץ בביצועים כל שנה. בעיבוד מקבילי כמונו או אנבידיה אפשר עדיין להכפיל כל פרוסס, אבל זה עדיין לוקח לנו שנתיים וחצי. לכן צריך לבנות שבבים שבנויים לסקייל ולא להסתמך על המערכות שקיימות היום".
תנ"ך מציין כי הצורך בכך רק יילך ויגבר, משום שאם לא יימצא פתרון לעלויות העיבוד, סטארט-אפים צעירים שירצו להציע שירותים חינמיים מבוססי AI כמו זיהוי פנים, או תרגום, לא יוכלו לעמוד בעלויות העיבוד לענן בשנייה שהם יגדלו. עלויות אלה, הוא מעריך, עלולות להגיע אף לסדרי גודל של כ-20-50 מיליון דולר בשנה.
"בעצם נוצר מצב שבקצוות יש כבר יכולות יישום AI בכל מקום - מהענן, ועד מכשירי הקצה - הסמארטפון האישי שלנו, או המערכת של מובילאיי ברכב. אבל כל מה שבתווך - נשאר מאחור. חברות כמו סלאק או סיילספורס שמשתמשות בשיטות AI כדי לשפר את המוצר שלהן נשארו מאחור כי התחילו מאוחר, שלא כמו גוגל שהחלה ב-2012", מפרט תנ"ך.
מאחר שמספר הלקוחות מצומצם, האמירה הרווחת כיום בקרב סטארט-אפים על השאיפה לגדול ולהפוך לחברה גדולה במקום למהר לאקזיט, פחות רלוונטית. זאת בניגוד לחברות המייצרות שבבים למכשירי קצה, שהוא שוק רחב ומגוון יותר ומכיל יצרניות רבות ומגוונות שמשאיר פתח להתרחבות ועצמאות גם של חברות שבבים קטנות כמו היילו או טריאיי.
כך, תנ"ך אומר במפורש שמאחר שהשבב של ניוריאליטי יכול להזניק את הביצועים של השבבים הקיימים, הוא אמור לקסום לכל אחת מחברות הענן. אלה, עשויות שלא רק להתעניין ברכישת השבבים, אלא ברכישת החברה עצמה, והוא אף נקב בנוסף לשמה של גוגל גם בשמן של אמזון ומיקרוסופט בתור רוכשות פוטנציאליות שעשויות לרכוש את החברה: "הן רוצות את זה. במקום לפתח ארבע שנים, הן יכולות לקנות בכחצי מיליארד דולר עד שני מיליארד דולר - זה כסף קטן בשבילן".
בינתיים מחפשת החברה הקטנה, המעסיקה 20 עובדים בלבד, לגדול משמעותית, ולאחר גיוס סיד של 8 מיליון דולר, מגלה תנ"ך, הם "כבר עם הפנים לגיוס הבא".