אני מדבר אתכם הרבה על חברות השבבים והדאטה סנטרים, אבל לפני שמתחילים לנתח מניות ולהבין מי הולכת להוביל את השוק, חשוב להבין את היסודות עצמם. עולם השבבים הוא אחד התחומים המשפיעים ביותר על הכלכלה הדיגיטלית, והוא גם אחד המבלבלים. כל הזמן שומעים שמות כמו CPU, GPU, TPU, ASIC וזה מרגיש כאילו צריך תואר בהנדסה כדי להבין מה קורה. הסיבה לכל הרעש הזה פשוטה, הבינה המלאכותית יצרה צורך בכוח עיבוד שלא הכרנו. ולכן הגיע הזמן לעשות סדר, מי נגד מי בקרב הזה ומה כל אחד מהמעבדים יודע לעשות.
CPU - Central Processing Unit המעבד הקלאסי והוותיק
ה - CPU הוא המעבד הקלאסי שכולנו מכירים, זה החלק שבמשך עשרות שנים היה הלב של כל מערכת מחשוב. הוא ורסטילי, יודע לבצע מגוון עצום של משימות, ומתוכנן להתמודד עם עיבוד לוגי ומערכתי ברמה גבוהה. היתרון הגדול שלו הוא הגמישות, הוא מסוגל לפתור בעיות מורכבות, לקבל החלטות ולנהל את כל שאר הרכיבים במערכת.
אבל ל ־ CPU יש גם מגבלה ברורה, הוא עובד בצורה סדרתית, משימה אחת אחרי השנייה. בעולם שבו בינה מלאכותית דורשת עיבוד של מיליוני פעולות במקביל, זה כבר לא מספיק. אפשר לדמיין את ה־CPU כמו עובד מקצועי, יסודי ומדויק, אבל שעובד לבד. מצוין כשצריך חשיבה מעמיקה או פעולות מורכבות בודדות, פחות יעיל כשנדרש "כוח ברוטלי" של חישובים מסיביים.
וכאן בדיוק מתחילה הבעיה, ה־CPU הוא נהדר כמעט לכל משימה רגילה, אבל כשהגענו לעידן ה AI שבו מיליארדי חישובי מטריצות מתבצעים בכל שנייה יש צורך במעבדים ייעודיים יותר שמותאמים לעיבוד מקבילי מאסיבי.
GPU – Graphics Processing Unit - מנוע העיבוד שמוביל את מהפכת ה-AI
כאן נכנס השחקן ששינה את כל התמונה, ה־GPU נולד בכלל מעולמות הגרפיקה, שם היה צריך לעבד מיליוני פיקסלים בו־זמנית. אבל הארכיטקטורה הייחודית שלו, אלפי ליבות קטנות ויעילות שמסוגלות לעבוד במקביל, הפכה אותו לסוס העבודה של הבינה המלאכותית. במקום לעבוד משימה אחר משימה, כמו CPU, ה־GPU יודע לפרק בעיה גדולה למספר עצום של חלקים קטנים ולעבד את כולם בו זמנית. וזה בדיוק מה שמודלים כמו GPT צריכים, עיבוד מטריצות ענקי, ברוחב פס עצום, ובקצבים שלא היו אפשריים לפניו.
היתרון הגדול של ה־GPU הוא לא רק הביצועים המרשימים, אלא גם הגמישות. הוא מתאים כמעט לכל משימת AI, וגם לתחומים נוספים כמו סימולציות מדעיות, עיבוד גרפי והדמיות פיזיקליות. סביבו נבנה אקו־סיסטם עצום של ספריות, כלים ופריימוורקים כמו CUDA ו־cuDNN של אנבידיה, שמאפשרים למפתחים לעבוד עליו בקלות ובמהירות.
וזו נקודה קריטית, עם השנים מפתחים ומתכנתים ברחבי העולם החלו לבנות את הקוד, התשתיות והמודלים שלהם ישירות סביב המערכת של אנבידיה. האלגוריתמים, האופטימיזציות, התשתיות והכלים המקצועיים, כולם מותאמים לעבוד עם GPU של אנבידיה. המשמעות היא שהמוצרים עצמם כתובים כך שיתממשקו בצורה הטובה ביותר עם החומרה של החברה. זה יוצר חפיר אדיר (יש לי על זה פוסט מפורט), גם אם יקום מחר שבב טוב יותר, אין לו גישה לאקו־סיסטם, לכלי הפיתוח, ולהרגלי העבודה שכבר נבנו במשך יותר מעשור סביב CUDA.
TPU – Tensor Processing Unit - השחקן הממוקד שנבנה במיוחד ל-AI
ה-TPU הוא אחד המעבדים המעניינים בעולם הבינה המלאכותית, בעיקר בגלל שהוא שונה מאוד ממה שאנחנו רגילים לראות. אם ה-GPU הוא כלי גמיש ורב־תכליתי, אז ה-TPU הוא מומחה, מעבד שגוגל בנתה מאפס כדי שיהיה טוב בדבר אחד בלבד, להריץ וללמוד מודלים של AI במהירות עצומה.
במקום לנסות לתמוך במגוון שימושים כמו GPU, ה-TPU ממוקד בפעולה המרכזית שמודלי AI עושים שוב ושוב, עבודה עם מטריצות, או במילים פשוטות, חישובים ענקיים שחוזרים על עצמם מאות אלפי פעמים בזמן אימון מודל. בגלל שהוא בנוי במיוחד כדי לבצע את הפעולות האלה, הוא פשוט עושה אותן הרבה יותר מהר ועם פחות אנרגיה.
זה מה שמאפשר ל-TPU להציג ביצועים יוצאי דופן באימון מודלים גדולים, הוא יכול להיות מהיר יותר אפילו מ-GPU מתקדם לא כי יש לו "יותר כוח", אלא כי הוא מותאם בצורה מושלמת לסוג החישובים שהמודלים האלה דורשים.
אבל ל-TPU יש גם מגבלות, הוא לא נמכר ככרטיס גרפי שאפשר לקנות בחנות, הוא לא עובד בכל מחשב, והוא לא מתאים לכל פריימוורק פיתוח. גוגל מציעה אותו בעיקר דרך הענן שלה, Google Cloud, ושם הוא משתלב הכי טוב. זו מערכת סגורה יחסית, מי שנמצא בתוך האקו־סיסטם של גוגל מרוויח מהמהירות שלו, ומי שלא פחות.
ASIC – Application-Specific Integrated Circuit - המעבד הכי יעיל בעולם, כשיש לו משימה אחת
ה־ASIC הוא סוג השבב הכי ממוקד וחד-משימתי שקיים. בניגוד ל־CPU או ל־GPU, שנבנו כדי להתמודד עם מגוון רחב של שימושים, ASIC מתוכנן מראש כדי לבצע פעולה אחת בלבד אבל לבצע אותה בצורה המהירה, המדויקת והחסכונית ביותר שאפשר. אפשר לדמיין אותו כמו מכונה ייעודית במפעל, היא לא יודעת לעשות הרבה דברים, אבל במשימה הספציפית שאליה היא נבנתה אין מי שיתקרב אליה.
כוחו הגדול של ASIC מגיע מההתאמה המושלמת בין הייעוד לבין הארכיטקטורה. כאשר השבב לא צריך להיות גמיש או להתמודד עם שימושים שונים, כל רכיב בו ממוקם בדיוק במקום הנכון כדי לספק ביצועים אופטימליים. זו הסיבה ש־ASIC צורך הרבה פחות חשמל, מאפשרים זמן עיבוד מהיר יותר, ומספקים יחס ביצועים לאנרגיה שאין לו תחרות. דוגמה מוכרת היא שבבים שנבנו לכריית ביטקוין, שמבצעים חישוב יחיד בצורה חזרתית ושם יעילות היא כל המשחק.
עם זאת, ל־ASIC יש חיסרון משמעותי, הוא לא גמיש בכלל. ברגע שהמשימה משתנה, השבב מפסיק להיות רלוונטי. לכן לא כל חברה בוחרת לבנות ASIC משלה, אלא רק אלו שיש להן צורך עצום בנפחי חישוב קבועים. חברות ענק כמו גוגל, אמזון ומטא פיתחו בשנים האחרונות שבבים ייעודיים לעצמן, משום שהשימושים שלהן קבועים, ברורים, ויכולים להצדיק השקעה של מאות מיליוני דולרים בפיתוח.
השוואה מהירה
|
סוג שבב |
למה הוא נועד? |
יתרון מרכזי |
חסרון מרכזי |
למי הוא מתאים? |
מי מייצר אותו? |
|
CPU – Central Processing Unit |
מחשוב כללי |
גמישות גבוהה |
איטי בעומסי AI |
מחשבים, שרתים, מערכות הפעלה |
Intel, AMD , APPLE |
|
GPU – Graphics Processing Unit |
עיבוד מקבילי ו־AI |
ביצועים גבוהים + אקו־סיסטם עצום |
צריכת חשמל וחום גבוהה |
אימון והרצת מודלי AI, סימולציות |
NVIDIA, AMD, |
|
TPU – Tensor Processing Unit |
AI בלבד, פעולות מטריצות |
יעילות ומהירות יוצאת דופן |
סגור לגוגל, פחות גמיש |
משתמשי Google Cloud, מודלי AI גדולים |
Google בלבד |
|
ASIC – Application-Specific Integrated Circuit |
משימה ייעודית אחת |
הכי יעיל בעולם למשימה ספציפית |
לא גמיש בכלל |
חברות ענן גדולות, קריפטו, תשתיות ייעודיות |
TSMC, INTEL , SAMSUNG |
למה בכלל חשוב להבין CPU, GPU, TPU ו־ASIC?
ההבדלים בין סוגי השבבים הם הליבה של אחד המהפכים הכלכליים הגדולים של זמננו. כל תשתית AI מדאטה סנטר של גוגל ועד סטארטאפ קטן, חייבת לבחור מעבד, והבחירה הזו משפיעה על עלויות, ביצועים, זמינות שירותים ואפילו על רווחיות החברות. ה־GPU של אנבידיה הפך לסטנדרט עולמי ולכן הביקוש אליו ממשיך לשבור שיאים. TPU מספק יתרון אדיר בתוך המערכת הסגורה של גוגל, ו־ASIC מיצרים עידן חדש של יעילות אנרגטית למי שיכול להרשות לעצמו לפתח שבב ייעודי. ההבדלים האלו יוצרים מפות כוח חדשות בשווקים, מכתיבים אסטרטגיות של חברות ענן ומעצבים את עתיד תעשיית החומרה.
לסיכום – השבבים הם הלב הפועם של מהפכת ה־AI
כשמביטים על התמונה המלאה, ברור שבינה מלאכותית היא הרבה מעבר למודלים ולנתונים, היא קודם כל יכולת חישוב. כל מעבד ממלא תפקיד שונה במערך הזה, ה־CPU מעניק יציבות וניהול, ה־GPU מעניק כוח מקבילי אדיר, ה־TPU דוחף גבולות בביצועים ייעודיים, וה־ASICים מסמנים עתיד שבו לכל משימה יהיה שבב מותאם אישית. ההבנה של המארג הזה היא מה שמאפשר להבין לאן השוק הולך, מי החברות שמסוגלות להוביל את הדור הבא, ואיך תיראה התחרות על כוח החישוב בעשור הקרוב. בסופו של דבר, העתיד של הבינה המלאכותית והעתיד הכלכלי שסביבה יוכרע על ידי מי שמחזיק את השכבה הכי בסיסית, אבל הכי קריטית, השבבים.


