Selasa, 6 Januari 2026 11:09 WIB

NVIDIA Rubin resmi meluncur, hardware AI generasi terbaru

NVIDIA resmi luncurkan platform Rubin di CES 2026. Bawa GPU HBM4 dan CPU Vera 88-core, tawarkan lonjakan performa 5x dibanding Blackwell.

Nur Chandra Laksana Penulis

NVIDIA secara resmi mengumumkan platform AI generasi berikutnya yang diberi nama Rubin dalam ajang CES 2026. Langkah ini mengejutkan industri karena peluncurannya dilakukan lebih awal dari jadwal yang diperkirakan, mempertegas dominasi NVIDIA dalam mempercepat siklus inovasi perangkat keras AI secara tahunan.

Platform Rubin dirancang untuk menjadi jantung dari pusat data masa depan, dengan fokus utama pada penanganan beban kerja kecerdasan buatan yang semakin kompleks seperti Agentic AI dan model Mixture-of-Experts (MoE). CEO NVIDIA, Jensen Huang, menyatakan bahwa Rubin bukan sekadar kumpulan cip, melainkan satu kesatuan superkomputer AI yang dirancang melalui metode extreme co-design untuk memberikan efisiensi biaya dan energi yang belum pernah ada sebelumnya.

Enam Cip Utama dalam Satu Ekosistem Terpadu

Kekuatan platform Rubin terletak pada integrasi enam cip baru yang bekerja secara harmonis di dalam satu sistem. Keenam komponen tersebut meliputi GPU Rubin yang masif, CPU Vera, switch NVLink 6, kartu jaringan ConnectX-9, BlueField-4 DPU, serta Spectrum-X untuk sistem photonics.

Seluruh komponen ini telah melewati tahap pengujian di laboratorium NVIDIA dan kini dinyatakan telah masuk ke fase produksi penuh. Integrasi yang sangat ketat antar komponen ini memungkinkan platform Rubin memperlakukan seluruh pusat data sebagai satu unit komputasi tunggal, menghilangkan hambatan komunikasi data tradisional yang sering menjadi kendala pada sistem berskala besar.

Bintang utama dari peluncuran ini adalah GPU Rubin yang membawa lonjakan performa hingga lima kali lipat dalam hal inferensi dibandingkan arsitektur Blackwell. Cip ini dibekali dengan 336 miliar transistor dan menjadi yang pertama menggunakan teknologi memori HBM4 dengan bandwidth mencapai 22 TB/detik.

Dalam pengujian performa, satu unit GPU Rubin mampu menghasilkan 50 PFLOPS untuk tugas inferensi NVFP4 dan 35 PFLOPS untuk pelatihan (training). Peningkatan kapasitas memori yang signifikan ini sangat krusial untuk menjalankan model bahasa besar (LLM) dengan triliunan parameter tanpa perlu melakukan partisi model yang rumit, sehingga proses pengembangan AI menjadi jauh lebih efisien.

Untuk mendampingi kekuatan GPU-nya, NVIDIA memperkenalkan CPU Vera yang menggunakan arsitektur kustom Arm generasi terbaru berkode "Olympus". Prosesor ini memiliki 88 inti (cores) dengan dukungan 176 threads melalui teknologi Spatial Multi-Threading. Vera dirancang khusus untuk koordinasi beban kerja AI, manajemen memori, dan orkestrasi sistem pusat data, bukan untuk komputasi umum.

Dengan kapasitas memori sistem hingga 1,5 TB LPDDR5x dan bandwidth 1,2 TB/detik, CPU Vera mampu memberikan performa pemrosesan data dan kompilasi kode dua kali lipat lebih cepat dibandingkan pendahulunya, CPU Grace, yang digunakan pada era Blackwell.

Konektivitas NVLink 6 dan Keamanan Rack-Scale

Sistem interkoneksi pada platform Rubin juga mendapatkan peningkatan besar melalui NVLink generasi ke-6 yang menawarkan bandwidth GPU-ke-GPU hingga 3,6 TB/detik. NVIDIA juga memperkenalkan teknologi Confidential Computing generasi ketiga yang menjadi solusi keamanan tingkat rak pertama di industri (Rack-scale TEE).

Fitur ini menjamin keamanan data proprietary dan model AI di seluruh domain CPU, GPU, hingga jaringan NVLink, memberikan perlindungan maksimal bagi perusahaan yang mengolah data sensitif. Selain itu, desain sistem yang 100 persen menggunakan pendingin cair (liquid cooled) memastikan stabilitas operasional pada kepadatan daya yang sangat tinggi di dalam rak server.

Salah satu janji utama dari platform Rubin adalah pengurangan biaya token inferensi hingga 10 kali lipat jika dibandingkan dengan platform Blackwell GB200. Penggunaan sistem Spectrum-X Ethernet Photonics juga diklaim lima kali lebih efisien dalam penggunaan daya dan sepuluh kali lebih andal dalam menjaga waktu aktif (uptime) jaringan.

Bagi perusahaan pengembang AI, hal ini berarti mereka dapat melatih model dengan jumlah GPU empat kali lebih sedikit namun mendapatkan hasil yang sama atau bahkan lebih baik. Efisiensi ini menjadi kunci utama bagi adopsi AI di tingkat arus utama (mainstream), di mana biaya infrastruktur sering kali menjadi penghalang bagi inovasi berskala luas.

Ketersediaan dan Dukungan Ekosistem Global

Platform Rubin akan tersedia dalam beberapa konfigurasi, termasuk rak Vera Rubin NVL72 yang menghubungkan 72 GPU Rubin dan 36 CPU Vera sebagai satu mesin AI raksasa. NVIDIA juga menyiapkan varian DGX Rubin NVL8 untuk pusat data kelas menengah yang membutuhkan performa tinggi namun dengan skala yang lebih kecil. Mitra utama seperti Microsoft dengan Fairwater AI superfactories dan CoreWeave dilaporkan akan menjadi pihak pertama yang mengadopsi sistem ini.

Dengan status produksi penuh saat ini, pengiriman unit pertama kepada pelanggan dijadwalkan akan dilakukan pada paruh kedua tahun 2026, menandai dimulainya babak baru dalam revolusi industri kecerdasan buatan global.