Nvidia Perkenalkan GPU Volta GV100 Yang Mengagumkan

Nvidia Perkenalkan GPU Volta GV100 Yang Mengagumkan

Nvidia kemarin memperkenalkan sebagian dari  dari arsitektur GPU Volta yang telah lama dinantikan oleh banyak kalangan, kali ini mereka menunjukkan GPU GV100 dan produk turunan pertama, yakni Tesla V100 pada acara GTC di San Jose. Sebagaimana kita tahu, Nvidia pertama kali menjatuhkan nama Volta di GTC pada tahun 2013, dan kita tampaknya harus menunggu hingga empat tahun untuk mengungkapkan rincian yang menarik ini. Tapi jika anda berharap GPU ini untuk gamer, jangan terlalu bersemangat; karena Nvidia masih melempar produk yang berasal dari Pascal (baru berumur satu tahun atau kurang). GPU ini dimaksudkan untuk bekerja di pasar AI dan komputer dengan kinerja tinggi (HPC), dimana fase Volta pertama ini akan datang untuk kalangan bisnis dan profesional.



Arsitektur GPU Volta GV100

Volta

GPU Volta GV100 menggunakan proses FSM TSMC 12nm, dimana ia memiliki lebih dari 21 miliar transistor, dan dirancang untuk aplikasi pembelajaran yang lebih mendalam. Nvidia mengatakan bahwa GPU Volta GV100 merupakan GPU terbesar yang pernah dihadirkan, dan mereka tidak mungkin membangun GPU yang lebih besar lagi pada teknologi proses saat ini, dimana sebelumnya GP100 merupakan GPU terbesar yang pernah diproduksi. Ketika  GP100 memiliki area permukaan hingga 610mm2 dan menampung 15,3 miliar transistor, yang terbaru GV100 lebih besar hingga memiliki perbedaan lebih dari 30%.

Volta

Untuk urusan spesifikasi, GPU Volta GV100 terdiri dari 84 SM (masing-masing fitur SM terdiri dari empat unit tekstur, dengan core 64 FP32, core 64 INT32, 32 FP64 core) yang diberi 128kB cache L1 per SM yang dapat dikonfigurasi untuk berbagai jenis cache tekstur dan rasio memori secara bersamaan. Berbeda halnya dengan GP100 yang hanya menampilkan 60 SM dan total CUDA core hingga 3840. Volta SMs juga menampilkan jenis inti baru yang mengkhususkan diri dalam pembelajaran Tensor dengan metode pembelajaran 4×4 Matrix. GV100 berisi delapan inti Tensor per SM, dan masing-masing inti mampu memberikan hingga kekuatan 120 TFLOPS untuk setiap operasi pelatihan dan inferensi. Untuk menghemat beberapa soal matematika, ia akan  membawa GPU GV100 memiliki bilangan penuh hingga 5.376 FP32 dan INT32 yang mengesankan, 2688 FP64 core, dan 336 unit tekstur.

GV100 juga dilengkapi empat emplasemen dari memori HBM2, seperti halnya pada GP100, dengan masing-masing tumpukan dikontrol oleh sepasang pengendali memori. Selain itu, ada delapan pengontrol memori 512-bit (sehingga memberi GPU ini memiliki lebar bus memori total 4.096-bit). Setiap pengontrol memori dilekatkan pada cache L2 768KB, dengan total cache L2 6MB (bandingkan dengan 4MB untuk Pascal).

Tesla V100

Untuk Nvidia Tesla V100 yang terbaru, ia memiliki 80 SM dengan total CUDA core hingga 5.120. Namun, ia masih memiliki potensi yang bisa mencapai hingga 7,5, 15, dan 120 TFLOP dalam perhitungan FP64, FP32, dan Tensor.

Volta

Tesla V100 sport ini memiliki memori 16GB HBM2, yang mampu mencapai hingga 900 GB / s. Ini berkat kehadiran  memori Samsung yang dipasang Nvidia pada Tesla V100 yang bisa mencapai 180 GB / s lebih cepat daripada memori yang ditemukan pada kartu Tesla P100. Nvidia mengklaim bahwa GPU ini  menggunakan memori tercepat yang tersedia di pasaran. Tesla V100 juga memperkenalkan NVLink generasi kedua, yang memungkinkan hingga 300 GB / s dengan lebih dari enam NVRAM 25GB / s per GPU.




Untuk memasukkan angka-angka itu ke dalam perspektif, perangkat lunak Tesla P100 dari Nvidia Pascal berasal dari 56 SM dan 3584 CUDA, yang menghasilkan 5,3 TFLP dalam perhitungan FP64, dan 10.6 TFLOP dalam perhitungan FP32. Sedangkan V100 menawarkan kemampuan komputasi yang lebih besar hingga 32 30% daripada P100, dan peningkatan kinerja FP64 hingga sebesar 50%. Selain itu, Nvidia juga meningkatkan bandwidth NVLink dari Tesla V100 hingga 50% dengan menambahkan dua NVLinks per GPU dibandingkan dengan Tesla P100 dan mereka juga meningkatkan bandwidth masing-masing NVLink sebesar 5GB / s.Nvidia mengatakan bahwa Tesla V100 membawa TDP 300W, dimana ini merupakan persyaratan kekuatan yang sama dengan Tesla P100.

Sumber referensi dan gambar : www.tomshardware.com

Baca juga :



Comments

VIDEO TERBARU MURDOCKCRUZ :

Indra Setia Hidayat

Saya bisa disebut sebagai tech lover, gamer, a father of 2 son, dan hal terbaik dalam hidup saya bisa jadi saat membangun sebuah Rig. Jauh didalam benak saya, ada sebuah mimpi dan harapan, ketika situs ini memiliki perkembangan yang berarti di Indonesia atau bahkan di dunia. Tapi, jalan masih panjang, dan cerita masih berada di bagian awal. Twitter : @murdockcruz Email : murdockavenger@gmail.com