CITIC Securities: Acara GTC Nvidia akan Segera Dimulai, Pratinjau Empat Poin Utama

robot
Pembuatan abstrak sedang berlangsung

NVIDIA GTC 2026 akan segera berlangsung, diperkirakan rangkaian produk chip perusahaan akan semakin diperluas. Selain rangkaian lengkap enam chip inti dari platform Vera Rubin AI, kemungkinan besar akan mengungkapkan detail lebih banyak tentang Rubin Ultra dan kabinetnya selama konferensi, membawa inovasi dalam arsitektur desain seperti konektivitas data dan pasokan energi, serta peningkatan produk baru seperti orthogonal backplane dan CPO. Selain itu, NVIDIA mungkin akan merilis chip inferensi LPU yang akan memperluas peta inferensi bersama chip CPX. NVIDIA juga berpotensi membahas arah peningkatan arsitektur Feynman generasi berikutnya, berbagi pandangan dan penilaian tentang infrastruktur komputasi masa depan dan industri AI. Diperkirakan GTC 2026 akan semakin memperkuat kepercayaan pasar terhadap pertumbuhan berkelanjutan industri AI dan realisasi logika peningkatan.

Sorotan 1: Platform Rubin menghadirkan kombinasi chip baru, menunjukkan desain kolaborasi yang optimal

Pada CES 2026, NVIDIA merilis rangkaian lengkap enam chip inti dari platform Vera Rubin AI: Rubin GPU, Vera CPU, BlueField-4 DPU, NVLink 6 Switch, ConnectX-9 SuperNIC, Spectrum-6 Ethernet Switch, yang mencakup semua komponen utama dalam kabinet. Proses pembuatan chip ini telah ditingkatkan ke teknologi 3nm dari TSMC dan dilengkapi HBM4, dengan kapasitas dan bandwidth memori yang sepenuhnya diperbarui. Kombinasi produk ini meningkatkan sinergi antara GPU dan CPU serta chip konektivitas, sementara desain modular membuat integrasi kabinet lebih kokoh dibandingkan generasi Blackwell sebelumnya.

Sorotan 2: Kemungkinan mengungkapkan detail lebih banyak tentang Rubin Ultra, menantikan inovasi arsitektur dalam konektivitas data dan pasokan energi

Mengacu pada konfirmasi bahwa platform Vera Rubin telah memasuki tahap produksi massal di CES 2026, kemungkinan besar GTC 2026 akan mengungkapkan lebih banyak detail tentang chip Rubin Ultra dan kabinetnya. Selain chip Rubin Ultra yang mengintegrasikan 4 die komputasi untuk meningkatkan performa komputasi dua kali lipat dibandingkan Rubin, ada dua arah utama dalam arsitektur yang patut diperhatikan:

  1. Dalam hal konektivitas data, skala meningkat secara signifikan. Skema backplane kabel tembaga mungkin akan digantikan oleh PCB orthogonal (interkoneksi antara papan kalkulasi dan switch dalam canister) dan interkoneksi optik (antar canister), membangun arsitektur jaringan super dua lapis. Teknologi dan bahan baru seperti 78L RPCB, M9 CCL, Q glass elektronik, dan CPO diperkirakan akan diimplementasikan.

  2. Dalam hal sistem pasokan energi: pasokan listrik dan konsumsi energi semakin menjadi kendala utama dalam perluasan basis komputasi. Sistem pasokan daya bertegangan tinggi 800V (HVDC) dan solusi pasokan modular diperkirakan akan diadopsi, membawa peningkatan teknologi seperti PCB embedded dan semikonduktor GaN generasi ketiga.

Sorotan 3: NVIDIA berpotensi merilis chip inferensi baru LPU untuk memperkuat lini produk inferensi

NVIDIA berpotensi menaikkan inferensi AI ke tingkat infrastruktur sistem, dengan solusi pemisahan PD antara LPU dan CPX yang memperkuat lini produk inferensi.

Dalam hal LPU: Pada GTC, NVIDIA diperkirakan akan meluncurkan chip inferensi baru yang mengintegrasikan teknologi Groq LPU, menggunakan arsitektur chip khusus yang dirancang untuk inferensi LLM, dengan desain ulang tensor streaming processor (TSP) dan SRAM sebagai memori on-chip, meningkatkan kecepatan penyimpanan dan pengambilan data secara signifikan, sangat cocok untuk kebutuhan bandwidth memori tinggi pada tahap decoding.

Dalam hal CPX: Produk Rubin CPX yang diperkenalkan NVIDIA pada 2025 dapat secara efektif menurunkan biaya prefill dan kemungkinan menggunakan GDDR7 atau HBM3E sebagai memori utama. Berdasarkan SemiAnalysis, CPX mungkin akan berwujud sebagai perangkat terpisah yang dipasangkan dengan NVL72 VR200, berbeda dari integrasi dalam Rubin Compute Tray sebelumnya. Berdasarkan informasi industri, LPU juga mungkin dirilis dalam bentuk kabinet LPX dengan 256 kartu.

Sorotan 4: Mengintip arah peningkatan arsitektur Feynman generasi berikutnya

Tren pengembangan arsitektur Feynman generasi berikutnya semakin mendapatkan perhatian industri. GTC 2026 kemungkinan akan menampilkan informasi terkait. Berdasarkan data industri saat ini, Trendforce memperkirakan Feynman akan menjadi chip pertama yang menggunakan proses A16 dari TSMC, dengan kemungkinan mengadopsi teknologi pasokan daya backside (Backside Power Delivery) untuk mengurangi kebutuhan ruang jalur, serta memperkenalkan teknologi stacking 3D untuk integrasi hardware Groq LPU. Perkiraan pelaksanaan produksi kemungkinan akan dimulai pada 2028 dan mulai dikirim ke pelanggan pada 2029. Detail spesifik arsitektur Feynman masih belum jelas, tetapi pemahaman NVIDIA tentang arah peningkatan infrastruktur komputasi AI di masa depan akan sangat penting. Dalam konteks perlambatan Hukum Moore, inovasi dalam kekuatan komputasi, memori, dan kemampuan operasional akan menjadi kunci untuk mendukung iterasi berkelanjutan industri AI, serta evolusi peran dan posisi pelatihan dan inferensi. Prediksi tentang siklus pengembalian investasi AI juga akan menjadi fokus, dan NVIDIA mungkin akan memberikan inspirasi dan kejutan di GTC.

Faktor risiko:

Fluktuasi ekonomi makro dan risiko geopolitik, peluncuran produk baru dari pemain utama di luar negeri yang tidak sesuai harapan, pertumbuhan permintaan pasar AI yang melambat, kenaikan harga komponen seperti penyimpanan, risiko perubahan teknologi dan iterasi produk, regulasi pemerintah dan risiko privasi data, serta meningkatnya kompetisi di industri PCB.

Strategi investasi:

Fokus pada inflasi rantai kekuatan komputasi. Dalam konteks permintaan global yang terus melebihi ekspektasi, prospek kenaikan harga dan kondisi pasar yang cerah di sektor teknologi tetap menjadi jalur utama dengan tingkat kepastian tertinggi. Dipercaya bahwa GTC 2026 akan semakin memperkuat kepercayaan pasar terhadap pertumbuhan berkelanjutan industri AI dan realisasi logika peningkatan.

Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • Komentar
  • Posting ulang
  • Bagikan
Komentar
Tambahkan komentar
Tambahkan komentar
Tidak ada komentar
  • Sematkan