Tantang Dominasi GPU, Intel & AMD Bersatu Racik CPU Khusus Berbasis AI
Selama beberapa tahun terakhir, panggung diskusi mengenai hardware kecerdasan buatan (AI) hampir selalu didominasi oleh GPU raksasa yang harganya selangit. CPU atau prosesor utama yang menjadi otak komputer seolah-olah cuma jadi penonton sekunder yang dianaktirikan. Namun, dinamika ini tampaknya akan segera bergeser. Dua rival abadi, Intel dan AMD, baru saja mengambil langkah mengejutkan dengan berkolaborasi merilis spesifikasi baru terfokus CPU yang disebut Advanced Compute Extensions (ACE).
Kehadiran ACE menjadi sinyal kuat bahwa kedua raksasa chip ini melihat celah besar di mana CPU sebenarnya bisa memegang peran yang jauh lebih efisien untuk menangani beban kerja machine learning tertentu.
Langkah ini bukan bertujuan untuk mendepak posisi GPU dalam pelatihan model AI skala raksasa (large-scale training). Sebaliknya, fokus ACE adalah mengoptimalkan pemrosesan model AI yang lebih kecil, tugas-tugas yang sensitif terhadap keterlambatan respon (latency-sensitive), serta sistem komputasi yang memang tidak memiliki atau tidak efisien jika harus menyalakan GPU.
Baca juga: AMD Resmi Bawa FSR 4.1 ke Radeon RX 7000 Series Melalui Driver Terbaru
Solusi Bottleneck
Bagi mereka yang sering berkutat dengan arsitektur komputer, mindah-mindahin data antara CPU dan GPU itu ada “ongkosnya” alias tidak gratis. Untuk beban kerja tertentu—terutama aplikasi yang butuh respon super cepat atau berjalan di hardware dengan spesifikasi terbatas—proses transfer data bolak-balik ini sering kali justru menjadi biang keladi kelambatan (bottleneck). Dengan mempertahankan seluruh beban kerja tetap berada di dalam CPU, masalah interkoneksi tersebut bisa dipangkas habis.
Secara teknis, ACE dirancang khusus untuk menangani kalkulasi matematika rumit bernama matrix multiplication (perkalian matriks) yang menjadi jantung dari hampir semua operasi AI. Selama ini, CPU sebenarnya bisa melakukan hitungan ini, tapi jalannya sangat terseok-seok dan tidak efisien karena terpaksa meminjam instruksi AVX yang dari awal memang tidak didesain untuk beban kerja matriks yang padat.
Di sinilah ACE mengambil pendekatan cerdas. Alih-alih memaksa para developer software berpindah ke format data atau model pemrograman yang baru, ACE tetap mempertahankan struktur register AVX10 yang sudah matang dengan input 512-bit, namun menanamkan hardware khusus (dedicated) untuk akselerasi matriks di dalam silikonnya.
Hasilnya? Pada tingkat instruksi, ACE mampu mengeksekusi operasi hingga 16 kali lebih banyak dibanding AVX10 standar untuk satu set data yang sama. Lonjakan efisiensi instruksi yang masif ini otomatis akan menghemat konsumsi daya listrik serta mengurangi beban pada bandwidth memori PC kita.
Konsistensi Developer & Fleksibilitas Format Data
Satu hal yang paling kami apresiasi dari desain ACE ini adalah sifatnya yang implementation-agnostic alias konsisten tanpa memandang merek chip yang digunakan. Ini tentu menjadi angin segar bagi para developer yang bekerja dengan framework populer seperti PyTorch dan TensorFlow. Mereka tidak perlu lagi pusing memilah-milah jalur kode pemrograman yang berbeda hanya karena variasi dukungan AVX pada prosesor tertentu. Cukup targetkan satu spesifikasi ACE, maka aplikasi bisa berjalan optimal baik di CPU Intel maupun AMD.
Fleksibilitas ACE juga terlihat dari dukungannya yang super luas terhadap berbagai tipe data machine learning, mulai dari yang ringan seperti INT8 dan FP8, hingga format presisi tinggi seperti FP32 dan BF16. Menariknya lagi, ACE sudah menyuntikkan dukungan bawaan untuk format skala blok Open Compute Project (OCP MX) yang bahkan absen di AVX10 standar. Fleksibilitas ini sangat krusial untuk menangani kebutuhan model AI modern di sisi inferensi (penerapan).
Di era sekarang di mana chip NPU (Neural Processing Unit) mulai menjamur namun standarisasinya masih berantakan, ACE menawarkan alternatif yang jauh lebih matang. Ketika kecepatan dan kesederhanaan sistem jauh lebih penting daripada efisiensi mutlak, melempar tugas AI ke CPU berteknologi ACE adalah opsi yang paling bersih dan ringkas. CPU terbukti belum mati di ranah AI; lewat evolusi arsitektur yang tepat, ia siap mengambil alih porsi kerjanya kembali dengan jauh lebih elegan.
VIDEO TERBARU MURDOCKCRUZ :