OpenAI Luncurkan GPT-4o: Lompatan Besar dalam Multi-Modal AI

OpenAI Luncurkan GPT-4o: Lompatan Besar dalam Multi-Modal AI

OpenAI telah meluncurkan model AI terbarunya, GPT-4o (GPT-4 Omni), yang menghadirkan beberapa kemajuan inovatif. Meskipun memiliki tingkat kecerdasan yang sama dengan GPT-4, GPT-4o menonjol karena kemampuannya memproses data teks, visual, dan audio secara bersamaan, latensi minimal dalam respons, dan suaranya yang sangat mirip manusia.

Baca juga: Rekomendasi SSD Untuk Editing Video & Foto: Cocok Untuk Content Creator

Chatbot saat ini, meskipun memiliki kemampuan canggih, sering kali mengalami kesulitan dengan latensi, sehingga menyebabkan penundaan yang nyata antara permintaan pengguna dan respons AI. Latensi ini dapat berkisar dari satu detik hingga beberapa detik, bergantung pada kompleksitas kueri. Perusahaan seperti Apple sedang menjajaki pemrosesan AI pada perangkat untuk mengurangi masalah ini. Namun, GPT-4o OpenAI mengambil pendekatan yang berbeda.

Selama demonstrasi hari Senin, GPT-4o menunjukkan waktu responsnya yang cepat, menjadikan interaksi lebih lancar dan lancar dibandingkan sesi chatbot pada umumnya. Model tersebut juga menangani interupsi dengan baik, dengan menghentikan sementara responsnya jika presenter mulai membahasnya, alih-alih terus berbicara.

Pemrosesan Multi-Modal yang Revolusioner

Salah satu faktor utama yang berkontribusi terhadap rendahnya latensi GPT-4o adalah kemampuannya memproses input teks, visual, dan audio secara bersamaan. Model sebelumnya, seperti ChatGPT, memerlukan model terpisah untuk menangani berbagai jenis masukan, yang sering kali menyebabkan penundaan karena sistem menunggu setiap model mengeluarkan hasilnya.

Namun GPT-4o mengintegrasikan semua jenis masukan ke dalam satu respons yang kohesif tanpa penundaan. CTO OpenAI Mira Murati menekankan bahwa kemampuan ini mewakili langkah maju yang signifikan dalam menjadikan interaksi AI lebih alami dan efisien.

“GPT-4o memberikan kecerdasan tingkat GPT-4 namun jauh lebih cepat,” kata Murati. “Kami pikir GPT-4o benar-benar mengubah paradigma tersebut ke masa depan kolaborasi, di mana interaksi ini menjadi lebih alami dan lebih mudah.”

Suara Seperti Manusia & Interaksi Real-Time

Fitur yang paling mencolok dari GPT-4o adalah suaranya yang terdengar seperti manusia. Selama demo, AI merespons dengan bahasa santai, jeda alami, dan bahkan tawa, membuatnya terdengar sangat manusiawi. Perkembangan ini meningkatkan standar secara signifikan, bahkan mengungguli Duplex Google dalam hal kualitas suara.

Namun, demo tersebut juga mengungkapkan beberapa keterbatasan. Saat dua contoh GPT-4o berbincang satu sama lain, interaksinya terasa lebih mekanis, menunjukkan bahwa kualitas AI yang mirip manusia lebih meyakinkan dalam interaksi satu lawan satu dengan manusia dibandingkan dengan AI lainnya.

Prospek Masa Depan & Pengumuman Tambahan

Meskipun ada beberapa kendala kecil, seperti mengoordinasikan duet antara dua instance AI dan respons yang terlalu antusias, potensi GPT-4o tidak dapat disangkal. Kemampuan model ini untuk menangani input multi-modal secara efisien dan kemampuan interaksinya yang mirip manusia menandai lompatan maju yang signifikan dalam teknologi AI.

Selain meluncurkan GPT-4o, OpenAI juga mengumumkan perilisan aplikasi desktop ChatGPT untuk macOS, dengan versi Windows yang diharapkan tersedia akhir tahun ini. Pengguna berbayar sudah memiliki akses ke aplikasi ini, dan versi gratis akan tersedia di kemudian hari. ChatGPT versi web kini menjalankan GPT-4o, dan model ini juga diharapkan dapat diakses oleh pengguna gratis dengan batasan tertentu.

Comments

VIDEO TERBARU MURDOCKCRUZ :

Indra Setia Hidayat

Saya bisa disebut sebagai tech lover, gamer, a father of 2 son, dan hal terbaik dalam hidup saya bisa jadi saat membangun sebuah Rig. Jauh didalam benak saya, ada sebuah mimpi dan harapan, ketika situs ini memiliki perkembangan yang berarti di Indonesia atau bahkan di dunia. Tapi, jalan masih panjang, dan cerita masih berada di bagian awal. Twitter : @murdockcruz Email : murdockavenger@gmail.com