نيرفّا Vera Rubin تثير طلب الذاكرة: تحليل مزايا وعيوب SK هاليكسي، سامسونج، ميكرون، SanDisk

عام 2026 معرض الإلكترونيات الاستهلاكية CES، أعلن الرئيس التنفيذي لشركة نفيديا هوانغ رين-نيو رسميًا عن دخول Vera Rubin مرحلة الإنتاج الضخم، مما يمثل نقطة تحول رئيسية في تاريخ تطوير الذكاء الاصطناعي (AI): من المرحلة المبكرة التي تركز على تدريب النماذج (Training) للذكاء الاصطناعي التوليدي، إلى عصر يهيمن عليه الذكاء الاصطناعي الوكيل (Agentic AI) والاستنتاج على نطاق واسع (Inference).

(هوانغ رين-نيو يحدد مؤتمر CES 2026: Vera Rubin تدخل الإنتاج الكامل، السيارات الذاتية القيادة للذكاء الاصطناعي ستطرح في الربع الأول، العمليات الرئيسية من TSMC)

سيقوم هذا التقرير بتحليل عميق لكيفية إعادة تشكيل هذا التحول التكنولوجي لمستوى الأجهزة في مراكز البيانات، خاصة مستوى التخزين G3.5 ومنصة ذاكرة السياق للاستنتاج (ICMS). في هذا السياق، تواجه أكبر أربعة عمالقة للذاكرة والتخزين في العالم: SK Hynix، سامسونج إلكترونيكس، Micron Technology، وSanDisk، فرصًا وتحديات غير مسبوقة.

ما هو HBM، DRAM، NAND؟ تحليل مصطلحات الذاكرة

قبل الدخول في المحتوى الرسمي، نوضح المصطلحات بشكل مبسط:

شرح مصطلحات الذاكرة بشكل مبسط: HBM (بما في ذلك HBM3E، HBM4، HBM5)

HBM الاسم الكامل High Bandwidth Memory (ذاكرة عالية النطاق الترددي). يمكن تصورها على أنها طبقات متعددة من شرائح DRAM مكدسة مثل كعكة طبقات، ومتصلة عبر طرق سريعة جدًا إلى وحدة المعالجة الرسومية (GPU)، لنقل البيانات بسرعة فائقة.

HBM3E: تستخدم حاليًا بشكل رئيسي في أحدث جيل من وحدات المعالجة الرسومية، بسرعة عالية واستهلاك طاقة منخفض.

HBM4: الجيل التالي، مخصص لوحدات GPU الأكثر قوة مثل Vera Rubin، مع عرض نطاق أعلى وسعة أكبر.

HBM5: الجيل التالي (قيد التخطيط)، سيرفع السرعة والسعة مرة أخرى، للتحضير لنماذج أكبر في المستقبل.

بالإضافة إلى ذلك، ستحتوي وحدة GPU الخاصة بـ Rubin على العديد من وحدات HBM المكدسة، مما يسمح لها بسرعة عالية جدًا بالحصول على البيانات. يعتمد التدريب والاستنتاج في الذكاء الاصطناعي بشكل كامل على HBM لتوفير البيانات، وهو النجم الأبرز في نقص إمدادات خوادم الذكاء الاصطناعي في هذه الموجة، حيث حولت الشركات قدرات إنتاجها بكميات كبيرة إلى تصنيع HBM، مما أدى إلى ضغط على إمدادات الذاكرة الأخرى. في عصر Vera Rubin، تعتبر HBM المكون الأكثر أهمية بين جميع الأجزاء.

شرح مصطلحات الذاكرة بشكل مبسط: SSD

SSD يشبه فلاش USB ضخم يستخدم لتخزين البيانات على المدى الطويل، ولا يُنسى عند إيقاف التشغيل. يتم تخزين الملفات، الفيديوهات، والألعاب على SSD (أو الأقراص الصلبة التقليدية). في عصر Vera Rubin، من أجل أن يتذكر روبوت الدردشة الكثير من النصوص، والحوار، والمعرفة، يحتاج Vera Rubin إلى توصيل العديد من SSD، كأنه مكتبة ضخمة من البيانات. تقدر Citi أن خادم Vera Rubin واحد يحتاج إلى توصيل حوالي 1,152TB (أي 1,152 قرص بسعة 1TB) من SSD ليعمل نظام ICMS الجديد.

في السابق، كانت SSD تعتبر أكثر من مجرد مكون ثانوي لمخزن البيانات، لكنها الآن تلعب دورًا مهمًا في ICMS/السياق الطويل للاستنتاج.

شرح مصطلحات الذاكرة بشكل مبسط: NAND

المادة التي تُخزن البيانات داخل SSD تسمى NAND فلاش الذاكرة. يمكن تصورها على أنها صفحات كتب مجمعة، وSSD هو خزانة كتب، وNAND هو مجموعة من صفحات الكتب. يحتاج ICMS الخاص بـ Vera Rubin إلى العديد من SSD، وداخل SSD توجد العديد من شرائح NAND، لذلك يحتاج AI إلى الكثير من NAND لتخزين النصوص والنتائج الوسيطة مع تزايد حجم النماذج وطول الذاكرة الحوارية.

شرح مصطلحات الذاكرة بشكل مبسط: DRAM

DRAM يشبه اللوح الأبيض للذاكرة قصيرة المدى، حيث يكتب عليه البيانات التي يحتاجها الكمبيوتر أثناء العمليات، وعند إيقاف التشغيل يُمسح. أسرع بكثير من SSD، لكنه ينسى البيانات عند إيقاف التشغيل. يستخدم في Vera Rubin كمكان عمل للمعالج (CPU / GPU) أثناء العمليات العادية. لا يُخزن المحادثات أو النماذج الضخمة لفترات طويلة، لكنه يدعم تشغيل النظام. ومع ذلك، بسبب تحويل قدرات الإنتاج إلى HBM، انخفض عرض إمدادات DRAM، وارتفعت الأسعار بشكل كبير، وأصبح هناك نقص.

شرح مصطلحات الذاكرة بشكل مبسط: LPDDR5X / DDR5

DDR5: نوع من الذاكرة الرئيسية المستخدمة في الخوادم وأجهزة الكمبيوتر المكتبية، أسرع من DDR4.

LPDDR5X: إصدار موفر للطاقة مخصص للأجهزة المحمولة أو وحدات المعالجة المركزية عالية الكثافة، يمكن تصورها على أنها “DRAM موفرة للطاقة”.

معالجات Rubin CPU تحتاج إلى الكثير من LPDDR5X أو DDR5 كذاكرة نظام، لإدارة التحكم، والجدولة، والمهام النظامية. لا ترتبط مباشرة بـ GPU مثل HBM، لكنها أساس استقرار خوادم AI. بسبب استحواذ HBM على القدرات، أصبح عرض DDR5 / LPDDR5X محدودًا، وارتفعت الأسعار.

شرح مصطلحات الذاكرة بشكل مبسط: High Bandwidth Flash (HBF)

يمكن تصور HBF على أنه NAND مع سرعة محسنة، بهدف جعل الفلاش (الذاكرة الفلاشية) لا يقتصر على التخزين البطيء، بل يصبح أسرع ويشبه الذاكرة للاستخدام. بالمقارنة مع SSD العادي، يركز على “سعة نقل عالية، تأخير منخفض”، لتمكين AI من قراءة وكتابة كميات كبيرة من السياق بسرعة أثناء الاستنتاج.

في Vera Rubin، يُستخدم كواحد من المكونات الأساسية لـ ICMS: يتم وضع كاش KV وبيانات السياق الطويل على نوع من الفلاش السريع، ويُستخدم الشبكة (مثل RDMA) لتمكين GPU من الوصول بسرعة قريبة من الذاكرة إلى KV Cache في الفلاش عن بعد. هذا هو مفهوم G3.5. حيث يتم ترقية الفلاش من مجرد تخزين إلى مكون خارجي يمكنه المشاركة في عمليات الحساب بسرعة عالية.

التحول الجذري في بنية Vera Rubin: إعادة هيكلة أساسية للهندسة

تصميم متكامل للغاية (Extreme Co-design) والحوسبة على مستوى الحاويات

في CES 2026، كشف هوانغ رين-نيو، الرئيس التنفيذي لشركة نفيديا، عن مفهوم أساسي: في جيل Rubin، لم تعد وحدة الحساب مجرد GPU أو خادم واحد، بل هي مركز بيانات كامل. تتكون منصة Rubin من ستة شرائح أساسية: Vera CPU، Rubin GPU، NVLink 6 Switch، ConnectX-9 SuperNIC، BlueField-4 DPU، وSpectrum-6 Ethernet Switch.

هذه الاستراتيجية، المعروفة باسم التصميم المتكامل للغاية، تهدف إلى القضاء على عنق الزجاجة في الاتصال بين الشرائح، وتحويل حاوية NVL72 إلى حاسوب عملاق واحد يمتلك قدرة استنتاج تصل إلى 3.6 إكسافلوبس وذاكرة عالية السرعة بسعة 75TB.

هذا التطور في الهيكلية ليس مجرد تكديس للأداء، بل هو استجابة للتغيرات الجوهرية في عبء عمل الذكاء الاصطناعي. من Blackwell إلى Rubin، تطور نماذج AI من مجرد روبوتات أسئلة وأجوبة إلى وكلاء ذكيين قادرين على تنفيذ استنتاجات متعددة الخطوات، واسترجاع الذاكرة طويلة المدى، واستخدام الأدوات. تتطلب هذه الأحمال من الأجهزة أن تكون ذات قدرة عالية على التحمل، مع استهلاك منخفض جدًا للوقت وتأخير، واحتفاظ هائل بالسياق.

الاستحواذ على Groq وتحول الاستنتاج: بداية عصر الاستحواذ الدفاعي و ASIC

في نهاية عام 2025، استحوذت نفيديا على شركة Groq الناشئة في مجال شرائح الذكاء الاصطناعي من خلال صفقة استحواذ بقيمة 20 مليار دولار وتراخيص تقنية، حيث تعتمد تقنية LPU (وحدة معالجة اللغة) الخاصة بـ Groq على ASIC مُحسّن بشكل كبير لنماذج Transformer. بخلاف وحدات GPU التقليدية التي تعتمد على HBM، تستخدم Groq ذاكرة SRAM على الشريحة ومصممة بشكل يركز على المترجم.

في سيناريوهات التفاعل الفوري، توفر هذه التقنية سرعة توليد رموز تصل إلى 10 أضعاف سرعة GPU التقليدية، مع كفاءة طاقة أعلى بعشرة أضعاف. تسعى نفيديا إلى دمج هذه التقنية مع بيئة CUDA، حيث أثبتت شركات مثل Google (TPU) وAmazon (Inferentia) أن الشرائح المخصصة توفر ميزة كبيرة في تقليل تكاليف الاستنتاج، لذلك تحتاج نفيديا إلى تقنية Groq للدفاع عن حصتها السوقية.

مشكلة جدار السياق (The Context Wall)

في استنتاج السياق الطويل، يُعد KV Cache آلية لتذكر تاريخ الحوار في نماذج AI. مع توسع نافذة السياق إلى ملايين الرموز، ينمو حجم KV Cache بشكل خطي، مما يستهلك بسرعة ذاكرة HBM باهظة الثمن وذات سعة محدودة على GPU (G1). عند امتلاء HBM، يتم إخراج البيانات إلى DRAM النظامي (G2) أو SSD المحلي (G3)، مما يؤدي إلى أزمة KV Cache: حيث يتوقف GPU غالبًا عن العمل مؤقتًا في انتظار البيانات التاريخية.

مستوى G3.5: منصة ذاكرة سياق الاستنتاج (ICMS)

في بنية Vera Rubin، أحد أكثر التحولات إثارة للثورة في صناعة الذاكرة هو مستوى الذاكرة G3.5، أو منصة ذاكرة سياق الاستنتاج (ICMS، ذاكرة سياق الاستنتاج)، والذي يمثل ولادة عصر الحوسبة المدركة للسياق (Context-Aware).

تستخدم ICMS وحدة BlueField-4 DPU وشبكة Spectrum-X Ethernet لإنشاء مخزن مؤقت مشترك يعتمد على الفلاش داخل الحاوية (Pod). يقع هذا المستوى G3.5 بين DRAM والتخزين التقليدي، ويستخدم تقنية RDMA (الوصول المباشر عن بعد للذاكرة) لتمكين GPU من الوصول بسرعة قريبة من الذاكرة إلى KV Cache في الفلاش عن بعد.

إجبار على تبني معايير تقنية جديدة (HBF & AI-SSD)

لتمكين NAND من أداء مهام الذاكرة شبه الدائمة، اضطرت الصناعة إلى تسريع دورة التطوير التكنولوجي، مما غير خارطة طريق الشركات المصنعة للذاكرة.

High Bandwidth Flash (HBF): من أجل زيادة النطاق الترددي، تتعاون SK Hynix وSanDisk لتطوير HBF، وهي تقنية تكديس ثلاثية الأبعاد تشبه HBM، لكنها تستخدم شرائح NAND، وتهدف إلى تقديم معدل نقل يفوق SSD التقليدي بعدة مرات، مخصص للاستنتاج في الذكاء الاصطناعي.

AI-NP SSD (AI-NP): تتعاون SK Hynix مع نفيديا لتطوير SSD عالي الأداء يمكنه تحقيق 100 مليون IOPS، وهو أداء يعادل 100 ضعف أداء أفضل SSD حالياً، مخصص لتلبية متطلبات ICMS في سرعة القراءة العشوائية، لضمان تزويد GPU بالبيانات في الوقت المناسب.

مستوى ICMS G3.5 هو الجسر الرئيسي الذي يمد سلسلة قيمة الذكاء الاصطناعي من HBM المكلف إلى NAND Flash، ويحل مشكلة الحاجة إلى ذاكرة غير محدودة لمعالجة المهام المعقدة، ويحول صناعة NAND من منتجات تخزين دورية إلى مورد أساسي في بنية الحوسبة للذكاء الاصطناعي.

تأثير تخزين NVL72 الخاص بـ Vera Rubin

وفقًا لتحليل Citi ومؤسسات أخرى، فإن الطلب على NAND في بنية Vera Rubin هو بشكل انفجاري. بالإضافة إلى التخزين القياسي، يضيف ICMS المدفوع بواسطة BlueField-4 حوالي 16TB من NAND عالي السرعة لكل GPU. بالنسبة لحاوية NVL72 التي تحتوي على 72 GPU، يعني ذلك طلبًا إضافيًا قدره 1,152TB (أي 1.15PB) من NAND.

إذا تم نشر 10,000 حاوية من هذا النوع عالميًا بحلول 2026، فسيؤدي ذلك إلى طلب إضافي يتجاوز 115 إكسابايت (EB) من NAND، وهو حوالي 12% من إجمالي إمدادات NAND العالمية لعام 2025. هذا الطلب كبير جدًا ويتطلب أداءً عاليًا جدًا، مما أدى إلى حالة من الذعر في السوق بشأن نقص إمدادات SSD المؤسساتية، وفتح دورة سوقية مهيمنة من قبل البائعين.

هذه الثورة في الهيكلية دفعت سوق الذاكرة إلى “ثلاثة دورات فائقة” (ارتفاع أسعار DRAM، نقص NAND، نفاد HBM). فيما يلي تحليل عميق لمنافسة أكبر أربع شركات:

SK Hynix (SK Hynix): مصمم بنية الذكاء الاصطناعي

المكانة

الهيمنة المطلقة على سوق HBM (حصة السوق في عصر HBM3/3E تتراوح بين 5~60%)، وشريك رئيسي لنفيديا.

الميزة

احتكار HBM4: تتوقع شركات الوساطة أن تتجاوز طلبات HBM4 في منصة Vera Rubin 70%، وأن يتم بيع كامل الإنتاج بحلول 2026.

تحديد معايير HBF: بالتعاون مع SanDisk، تدفع نحو تطوير High Bandwidth Flash (HBF)، بهدف رفع NAND إلى مستوى الذاكرة شبه الدائمة.

SSD عالي الأداء خاص بـ AI-NP: تطوير SSD بأداء فائق يصل إلى 100 مليون IOPS مخصص لـ ICMS.

العيوب

تواجه SK hynix الآن دورة فائقة في الذكاء الاصطناعي، مع HBM3E / HBM4 تقريبًا ممتلئة، وتُعترف في التوقعات أن هناك مخاطر تعديل الأسعار وزيادة المنافسة بعد 2026. وتحديدًا، تعتمد بشكل كبير على HBM، وأي تراجع في الأسعار أو زيادة العرض بعد 2026 قد يضر أرباحها بشكل كبير.

سامسونج إلكترونيكس (Samsung): رد فعل الإمبراطورية وميزة القدرة الإنتاجية

المكانة

مزوّد حلول شامل، عملاق الإنتاج.

الميزة

Turnkey HBM4: شركة تقدم خدمة متكاملة تشمل الذاكرة، والتصنيع المنطقي، والتعبئة، تجذب عملاء مثل Google وAmazon الذين يطورون شرائح خاصة بهم.

مستفيد مباشر من G3.5: أكبر مصنع NAND عالمي، يمتلك قدرات قوية في SSD المؤسساتية وذاكرة CXL (PBSSD)، قادرة على تلبية طلبات HBM والتخزين الضخم في آن واحد.

العيوب

تكنولوجيا HBM بدأت متأخرة، وتحتاج إلى إعادة بناء ثقة العملاء في جيل Rubin؛ على الرغم من وجود كميات من NAND، إلا أن السيطرة على التسعير أقل قوة من HBM.

Micron (Micron): المستفيد من الكفاءة والجغرافيا السياسية

المكانة

خيار الذكاء الاصطناعي المفضل في الولايات المتحدة، يقود مع HBM و NAND.

الميزة

مستفيد مزدوج: الشركة الأمريكية الوحيدة التي تمتلك قدرات إنتاج HBM3E/4 وشرائح SSD متقدمة، وتستفيد من كلا مستويي ذاكرة Rubin GPU وICMS.

كفاءة الطاقة: تدعي منتجات HBM أنها أكثر كفاءة بنسبة 30% من المنافسين، وتلبي متطلبات TCO لمراكز البيانات.

مكاسب جيوسياسية: باعتبارها المصنع الأمريكي الوحيد، فهي الخيار الأول للسحابة الذكاء الاصطناعي ذات السيادة في أمريكا الشمالية.

العيوب

إجمالي القدرة الإنتاجية أقل من الشركات الكورية الكبرى، وتحتاج إلى الاعتماد على قيمة تقنية عالية للحفاظ على هوامش ربح مرتفعة، ولا يمكنها خوض حرب الأسعار.

SanDisk: إعادة تقييم قيمة التخزين والحوسبة

المكانة

أكبر مستفيد من مستوى G3.5، وتحول إلى شركة بنية تحتية للذكاء الاصطناعي.

الميزة

أكثر الشركات تمثيلًا لمفهوم G3.5: الطلب على NAND بمقدار 1,152TB لكل نظام Rubin هو زيادة صافية من SanDisk. وقد حصلت على اعتماد من عملاء كبار على منتجاتها من SSD المؤسساتي Stargate.

تحول الأعمال: بعد فصلها عن Western Digital، ركزت استراتيجيتها بالكامل على مراكز البيانات (نمو إيراداتها بنسبة 26% سنويًا)، وتخلت عن عبء المنتجات الاستهلاكية.

قوة التسعير: مع نقص الإمدادات، قد تتضاعف أسعار NAND المؤسساتية، وتتمتع SanDisk بهوامش ربح عالية جدًا.

العيوب

لا تمتلك مصانع شرائح خاصة بها، وتعمل بنظام التعاقد مع شركات تصنيع أخرى، وضعف القدرة على قفل القدرة الإنتاجية مقارنة بـ IDM.

تحليل التوقعات قبل 2026: سوق البائعين للذاكرة يتشكل

تتفق كل من Nomura وCiti على أن السوق سيواجه اختلالًا حادًا في العرض والطلب بحلول 2026. من المتوقع أن ينمو إيرادات DRAM بنسبة 51% سنويًا، وأن تتضاعف أسعار عقود شرائح NAND. بسبب نقص غرف النظافة (Cleanroom) واستهلاك HBM لقدرته على تصنيع الشرائح (استهلاك HBM يعادل ثلاثة أضعاف DRAM)، ستستمر الضغوط على الإمدادات حتى منتصف 2027. في موجة تحديث الصناعة التي تقدر قيمتها بـ 10 تريليون دولار، أدت ظهور Vera Rubin ومنصة ICMS إلى تحويل شركات الذاكرة من أدوار ثانوية إلى أدوار رئيسية.

بالنظر إلى 2026–2028، بالإضافة إلى قيود توسعة HBM واحتقان ICMS في سوق SSD المؤسساتي، قد يظهر محفز آخر: جدول زمني لتسويق HBF (تكديس NAND عالي النطاق الترددي). يتفق المجتمع الأكاديمي والصناعة على أن، نظرًا لأن HBF يمكن أن يستخدم بعض أساسيات التكديس والتعبئة التي تم تطويرها خلال عصر HBM، فإن وتيرة تبنيها قد تكون أسرع من HBM، ومن المتوقع أن تدخل مرحلة التكامل مع المنصات الرئيسية قبل عام 2027.

STG2.91%
شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
0/400
لا توجد تعليقات
  • Gate Fun الساخن

    عرض المزيد
  • القيمة السوقية:$0.1عدد الحائزين:0
    0.00%
  • القيمة السوقية:$5.84Kعدد الحائزين:3
    15.42%
  • القيمة السوقية:$3.08Kعدد الحائزين:2
    0.93%
  • القيمة السوقية:$2.95Kعدد الحائزين:2
    0.05%
  • القيمة السوقية:$2.92Kعدد الحائزين:2
    0.00%
  • تثبيت