Model AI ZAYA1 Berhasil Dilatih Penuh di Platform GPU AMD MI300X
AMD dan Zyphra hari ini mengumumkan pencapaian penting dalam dunia kecerdasan buatan: untuk pertama kalinya, sebuah Mixture-of-Experts (MoE) foundation model berskala besar berhasil dilatih sepenuhnya menggunakan platform GPU AMD Instinct™ MI300X dan networking AMD Pensando™. Model tersebut—diberi nama ZAYA1—menjadi bukti bahwa ekosistem perangkat keras AMD kini mampu bersaing di level tertinggi pelatihan model AI modern.
Dalam laporan teknis yang dirilis Zyphra, ZAYA1 menunjukkan performa kompetitif, bahkan unggul di beberapa tolok ukur reasoning, matematika, dan kemampuan coding, melampaui sejumlah model open-source populer seperti Qwen3-4B, Gemma3-12B, Llama-3-8B, hingga OLMoE.
Baca juga: Review ASUS TUF Gaming Radeon RX 9070 XT OC 16GB: Powerful Tapi Ada Kompromi
AMD Siap di Arena AI Skala Besar
Emad Barsoum, Corporate VP AI & Engineering AMD, menyebut pencapaian ini sebagai bukti bahwa AMD Instinct MI300X bukan hanya alternatif, tetapi benar-benar siap untuk menangani training model generasi berikutnya.
“Tonggak ini menunjukkan kekuatan dan fleksibilitas GPU AMD Instinct serta jaringan AMD Pensando dalam melatih model berskala besar,” ujar Barsoum.
Dengan kapasitas memori raksasa 192GB HBM3, MI300X memungkinkan Zyphra melakukan pelatihan tanpa perlu expert sharding atau tensor sharding—dua teknik yang sering mempersulit distribusi model besar. Tanpa overhead tersebut, proses menjadi lebih sederhana dan throughput meningkat signifikan.
Zyphra juga mengklaim peningkatan lebih dari 10× lebih cepat untuk proses penyimpanan model (model save time) berkat optimasi I/O terdistribusi dari AMD, sehingga pelatihan tidak hanya lebih efisien tetapi juga lebih stabil.
ZAYA1-Base memiliki 8.3 miliar parameter total, namun hanya 760 juta parameter aktif pada setiap langkah inferensi—salah satu keunggulan arsitektur MoE. Dengan konfigurasi tersebut, ZAYA1 mampu menyamai atau bahkan mengungguli model lebih besar dari ekosistem raksasa teknologi lainnya.
CEO Zyphra, Krithik Puthalath, menekankan bahwa filosofi efisiensi menjadi landasan desain ZAYA1.
“Kami memilih perangkat keras dengan price-performance terbaik. ZAYA1 adalah hasil dari filosofi co-design—model, silikon, dan sistem yang dirancang sejalan,” ujarnya.
Kolaborasi AMD, Zyphra, dan IBM
Perjalanan ini bukan dilakukan Zyphra sendirian. AMD dan IBM bekerja sama membangun kluster pelatihan khusus, menggabungkan:
- GPU AMD Instinct MI300X
- AMD Pensando networking fabric
- Infrastruktur IBM Cloud berperforma tinggi
Kluster inilah yang menjadi tulang punggung pre-training ZAYA1.
Rilis laporan teknis penuh, blog Zyphra, dan blog AMD memberikan rincian lebih mendalam mengenai arsitektur ZAYA1, metodologi pelatihan, serta optimasi yang membuat pelatihan skala besar di atas perangkat keras AMD menjadi mungkin.
Bagi industri AI, pencapaian ini menjadi sinyal bahwa dominasi satu vendor—yang selama ini dianggap mutlak—mulai mendapatkan tantangan nyata. Jika performa dan efisiensi AMD konsisten, ekosistem AI mungkin akan memasuki era yang lebih kompetitif, lebih terbuka, dan lebih terjangkau.
VIDEO TERBARU MURDOCKCRUZ :

