Senin, 29 September 2025 12:03 WIB

Huawei Cloud rilis layanan token AI

Huawei Cloud umumkan Layanan AI Token dengan CloudMatrix384. Akselerasi inferensi AI 3-4x lebih cepat, jadi fondasi kuat di era kecerdasan digital.

Nur Chandra Laksana Penulis

Sudah bukan zamannya lagi komputasi AI itu ribet dan lambat. Pada gelaran hari kedua HUAWEI CONNECT 2025, Zhang Ping'an, Direktur Eksekutif dan CEO Huawei Cloud, menyampaikan berbagai inovasi yang bertujuan menyederhanakan kompleksitas infrastruktur AI.

Intinya, Huawei Cloud fokus menghadirkan hasil akhir dari komputasi AI langsung kepada pengguna, menjadikan pemanfaatan kemampuan inferensi (inference) menjadi sangat efisien. Dalam konferensi ini, Zhang Ping'an secara resmi meluncurkan Layanan AI Token yang didukung teknologi CloudMatrix384, menjanjikan kinerja, layanan, dan kualitas yang unggul kepada pelanggan.

CloudMatrix384: Komputasi AI yang Memisahkan Batasan

Inovasi inti yang memungkinkan efisiensi ekstrem ini terletak pada Superkomputer CloudMatrix384. Sistem ini memusatkan semua sumber daya—mulai dari komputasi, memori, hingga penyimpanan. Lebih lanjut, sistem ini secara cerdas memisahkan kegiatan komputasi, penyimpanan, dan sistem pakar AI. Dengan memecah kegiatan berurutan tersebut menjadi tugas yang dapat dikerjakan secara bersamaan dan terdistribusi, kinerja sistem dalam menjalankan inferensi meningkat drastis.

Sebagai hasilnya, kinerja rata-rata per kartu di CloudMatrix384 mencapai 3 hingga 4 kali lebih tinggi dibandingkan produk serupa, seperti H20, dalam skenario inferensi online, nearline, dan offline. Hal ini menunjukkan bahwa arsitektur yang dirancang ulang ini memberikan peningkatan signifikan bagi pelanggan yang ingin memaksimalkan throughput AI mereka.

Strategi Ekosistem dan Pertumbuhan Pelanggan

Zhang Ping'an menambahkan bahwa Huawei Cloud akan mengalokasikan lebih banyak sumber dayanya untuk komputasi dan AI. Tujuannya adalah menciptakan "lahan subur" atau fondasi yang kuat agar aplikasi AI dari berbagai industri dapat berjalan lebih lancar dan optimal. Komitmen ini terbukti dari pertumbuhan pelanggan global yang signifikan; jumlah pelanggan yang menggunakan Layanan Komputasi AI dari Huawei Cloud meningkat pesat dari 321 pada tahun 2024 menjadi 1.805 pada tahun ini.

Huawei Cloud juga akan terus meningkatkan investasi dalam Model Pangu. Investasi ini bertujuan untuk mendalami skenario industri guna memahami kebutuhan pelanggan dengan lebih baik, serta membantu pelanggan di berbagai industri mengembangkan model AI mereka sendiri. Hingga saat ini, Model Pangu telah diterapkan di lebih dari 500 skenario di 30 industri, membuka berbagai kemungkinan baru di sektor-sektor tersebut.

Satu Infrastruktur Cloud Global dan Dua Mesin

Di hari yang sama, Charles Yang, Wakil Presiden Senior dan Presiden Layanan Pemasaran & Penjualan Global Huawei Cloud, menekankan bahwa kalangan bisnis menghadapi tantangan yang kompleks di era kecerdasan digital. Huawei Cloud menyadari posisinya untuk menyediakan sistem pendukung yang menyeluruh dalam "satu infrastruktur cloud global dan dua mesin: data dan AI" bagi pelanggan globalnya.

Elemen pertama dari sistem ini adalah KooVerse, infrastruktur cloud global yang menawarkan layanan cloud yang fleksibel. Elemen kedua adalah layanan pemanfaatan data, yang menyediakan data secara efisien dan memaksimalkan nilainya. Terakhir, elemen ketiga adalah platform terpadu pengembangan AI yang membantu kalangan bisnis membangun aplikasi berbasis AI dan berinovasi dengan lebih mudah. Huawei Cloud menghimpun praktik-praktik terbaik dalam transformasi digital dan kecerdasan, dan menyediakannya melalui layanan cloud untuk membantu lebih banyak pelanggan meraih sukses di pasar global.