لقد لاحظت شيئًا مثيرًا يظل معظم الناس نائمين عليه. كان الجميع مهووسًا بإمدادات وحدات معالجة الرسوميات لسنوات، لكن سرًا، أصبحت وحدات المعالجة المركزية هي القيد الحقيقي في بنية الذكاء الاصطناعي. وهذا التحول يحدث بسرعة أكبر مما يدركه معظم الناس.



في الشهر الماضي، أعلنت جوجل وإنتل عن صفقة ضخمة متعددة السنوات خصيصًا لمعالجة هذا الاختناق في وحدات المعالجة المركزية. كانت رسالة إنتل واضحة: الذكاء الاصطناعي لا يعمل على وحدات معالجة الرسوميات فقط—وحدات المعالجة المركزية وتنظيم النظام أصبحا العامل المحدد الآن. في غضون ذلك، ارتفعت أسعار معالجات الخوادم بنحو 30% في الربع الرابع من العام الماضي، وهو أمر جنوني لسوق ناضج. مدة تسليم معالجات AMD امتدت من 8 أسابيع إلى أكثر من 10 أسابيع، مع بعض القطع التي تواجه تأخيرات تصل إلى 6 أشهر. هذا ليس مجرد ضجيج—إنه ضغط حقيقي على الإمدادات.

السخرية قاسية: مختبرات الذكاء الاصطناعي لديها الكثير من وحدات معالجة الرسوميات التي تجلس بدون استخدام، لكنها لا تستطيع الحصول على ما يكفي من وحدات المعالجة المركزية عالية الأداء لتشغيلها فعليًا. سعة TSMC على تقنية 3 نانومتر تتعرض لضغط من طلبات وحدات معالجة الرسوميات، لذا يتم إعادة تخصيص حصة شرائح المعالجة المركزية باستمرار. حتى إيلون ماسك دخل في لعبة المعالجات، وطلب من إنتل تصميم شرائح مخصصة لمشروع تيرافاب في تكساس. هذا هو مدى ضيق الأمور.

لماذا التحول المفاجئ؟ لأنه عبء العمل الخاص بالوكلاء يختلف تمامًا عن الاستنتاج التقليدي. الدردشات الآلية غالبًا ما تعتمد على وحدات معالجة الرسوميات في الحسابات. لكن الوكلاء؟ يحتاجون إلى تنظيم واجهات برمجة التطبيقات، إدارة قواعد البيانات، تنفيذ الشفرات، وتنسيق النتائج—وكلها مهام تعتمد بشكل كبير على المعالجة المركزية. وجد باحثو معهد جورجيا للتكنولوجيا أن العمل على جانب المعالج الآن يمثل 50-90% من إجمالي الكمون في أنظمة الوكلاء. وحدة معالجة الرسوميات جاهزة للعمل، بينما لا يزال المعالج يتعامل مع استدعاءات الأدوات.

تضخم نوافذ السياق لا يساعد أيضًا. النماذج الآن تدعم أكثر من مليون رمز، وذاكرة التخزين المؤقت لـ KV تصل إلى حوالي 200 جيجابايت—أي أكثر بكثير مما يمكن أن تحمله وحدة H100 واحدة. على وحدات المعالجة المركزية أن تتولى إدارة هذه الذاكرة، لذا فهي ليست فقط تنسق، بل تتعامل مع إدارة بيانات جادة.

انظر كيف تستجيب الشركات المصنعة. الرئيسة التنفيذية لشركة AMD، ليزا سو، كانت واضحة جدًا حول هذا: عبء العمل على الوكلاء يدفع المهام مرة أخرى إلى وحدات المعالجة المركزية التقليدية، وهذا يدفع نموها. بلغت إيرادات مركز البيانات في AMD 5.4 مليار دولار في الربع الرابع، بزيادة 39% على أساس سنوي، مع وحدات EPYC التي تقوم بالعمل الثقيل. تجاوزت حصة AMD في سوق وحدات المعالجة المركزية للخوادم 40% للمرة الأولى. لكن AMD لا تزال تفتقر إلى قدرات الربط بين وحدة المعالجة المركزية ووحدة معالجة الرسوميات التي تبنيها NVIDIA مع NVLink.

نظرت NVIDIA من زاوية مختلفة. معالج Grace الخاص بهم يضم 72 نواة فقط مقابل 128 نواة في AMD أو التكوينات النموذجية من إنتل. بدلاً من التركيز على عدد النوى، قامت NVIDIA بتحسين التعاون—نقطة اتصال NVLink C2C تدفع عرض النطاق الترددي إلى 1.8 تيرابايت/ثانية، مما يسمح للمعالج بالوصول مباشرة إلى ذاكرة وحدة معالجة الرسوميات. بدأوا في بيع Grace كمنتج مستقل، وMeta قامت مؤخرًا بنشر "نشر Grace خالص" دون إقرانه بوحدات معالجة الرسوميات. هذا إشارة.

تلعب إنتل كلا الجانبين—تدفع بمعالجات Xeon بشكل عميق في شراكات مع شركات الحوسبة السحابية الضخمة، وفي الوقت نفسه تتعاون مع SambaNova على حلول هجينة تشغل استنتاج الوكيل بدون وحدات معالجة الرسوميات. عملية 18A وخارطة طريق Xeon 6 Granite Rapids ستكون حاسمة بالنسبة لهم.

إليك الصورة الأكبر: شراكة أمازون مع $38B OpenAI تذكر صراحة نشر "عشرات الملايين من وحدات المعالجة المركزية". هذا تحول عن خطة اللعب القديمة التي كانت تعتمد على "مئات الآلاف من وحدات معالجة الرسوميات". تتوقع بنك أوف أمريكا أن سوق المعالجات يمكن أن يتضاعف من $27B إلى $60B بحلول عام 2030، وهو تقريبًا مدفوع بالكامل بالذكاء الاصطناعي.

ما نراه حقًا هو إعادة بناء كاملة للبنية التحتية. الشركات لم تعد تركز فقط على توسيع وحدات معالجة الرسوميات—بل تبني في الوقت نفسه طبقة كاملة من بنية تنظيم المعالجات المركزية مصممة خصيصًا للوكالات الذكية. عندما يصبح الحساب وفيرًا، تصبح كفاءة النظام على مستوى النظام هي الميزة التنافسية. لن يتم تحديد الفائزين التاليين في الذكاء الاصطناعي بواسطة أعداد وحدات معالجة الرسوميات الخام؛ بل بواسطة من يحل مشكلة قيد المعالجة المركزية أولاً.
شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
إضافة تعليق
إضافة تعليق
لا توجد تعليقات
  • تثبيت