Google baru saja meluncurkan Gemini, yang mereka gambarkan sebagai “model AI terbesar dan paling canggih” mereka.
Model bahasa besar (LLM) baru ini hadir dalam tiga ukuran: Ultra, Pro, dan Nano – dari pusat knowledge hingga perangkat mobile.
Beberapa klaim terbesar berkenaan Gemini termasuk akurasi dan kinerjanya, dan juga kebolehan multimodal bawaannya.
CEO Google Sundar Pichai memperkenalkan Gemini dalam sebuah pos blog, dan menyatakan salah satu tujuan utama Gemini adalah “membuat AI lebih membantu bagi semua orang.”
ADVERTISEMENT
SCROLL TO RESUME CONTENT
Google sudah menginvestasikan banyak sumber kekuatan terhadap Gemini di balik layar, dengan berita penuh berkenaan kemajuan dalam ChatGPT, dan lebih-lebih Grok.
Proyek Gemini sudah menjadi “salah satu upaya pengetahuan pengetahuan dan rekayasa terbesar yang dulu kita melakukan sebagai perusahaan,” menurut Pichai. Google sudah berinvestasi dalam “alat, jenis dasar, dan infrastruktur yang terlalu baik.”
CEO Google menyoroti kecepatan perubahan dan momentum di balik AI.
“Jutaan orang saat ini menggunakan generative AI di produk-produk kita untuk melakukan hal-hal yang lebih-lebih tidak dapat dijalankan setahun yang lalu,” katanya.
Namun, dengan kebolehan besar datang tanggung jawab besar, dan Pichai termasuk memberikan pesan kuat berkenaan menjadi berani tetapi bertanggung jawab. Untuk itu, Gemini akan fokus terhadap mengimbuhkan fungsi – tetapi dengan perlindungan.
Gemini 1.0 hadir dalam tiga ukuran:
Gemini Ultra — jenis terbesar dan paling canggih untuk tugas yang terlalu kompleks.
Gemini Pro — jenis paling baik untuk skalabilitas di berbagai tugas.
Gemini Nano — jenis paling efektif untuk tugas di perangkat.
Demis Hassabis, CEO dan Pendiri Google DeepMind, termasuk turut berkontribusi dalam pos blog pengumuman berkenaan Gemini.
Hassabis merenung berkenaan latar belakang pengembangan AI-nya dalam game selama jaman remajanya, lantas sebagai peneliti neurosains, sebelum akan jaman gemilangnya di pimpinan DeepMind.
Hassabis menyebut salah satu keinginannya yang terbesar adalah membuat perubahan AI dari pengalaman perangkat lunak menjadi lebih mirip dengan asisten atau pembantu ahli.
Bicara berkenaan Gemini, dan sebagian demonstrasinya, banyak berpusat terhadap kebolehan multimodalnya.
Gemini dibangun dari awal dengan kebolehan ini. Kemampuan multimodalnya berarti bahwa ia “dapat menggeneralisasi dan dengan lancar memahami, beroperasi di, dan mengkombinasikan berbagai jenis informasi termasuk teks, kode, audio, gambar, dan video.”
Google terlalu fokus terhadap kebolehan dan kinerja Gemini. Perusahaan share hasil benchmarking detail di blognya, menunjukkan bahwa Gemini sudah diuji secara ketat dan akan mengimbuhkan hasil yang akurat di berbagai tugas dan penalaran.
Google termasuk membanggakan bahwa “Gemini Ultra adalah jenis pertama yang melebihi ahli manusia dalam pemahaman bahasa multitugas besar,” layaknya yang ditunjukkan oleh skor 90% dalam benchmark akademis yang banyak digunakan untuk menilai LLM.
Google menyatakan bahwa MMLU “menggunakan kombinasi dari 57 mata pelajaran layaknya matematika, fisika, sejarah, hukum, kedokteran, dan etika untuk menguji pengetahuan dunia dan kebolehan pemecahan masalah.
” Google termasuk mengklaim bahwa Gemini akan menggunakan penalarannya untuk lebih hati-hati dalam menjawab pertanyaan sukar untuk “peningkatan yang signifikan” dalam hasil. Kami berasumsi bahwa itu berarti Google menghendaki Gemini tidak akan rentan terhadap halusinasi layaknya banyak pesaing LLM kontemporer,” Katanya
Google Deepmind dengan percaya diri memperbandingkan Gemini yang baru dengan LLM GPT dari OpenAI. Solusi Open AI adalah tolak ukur terhadap semua pesaing lain yang tak terelakkan diukur, dan Anda dapat melihat bahwa Gemini dibandingkan terlalu untungkan dalam tabel tugas benchmark AI.
Diketahui bahwa GPT-4 adalah iterasi terakhir dan paling canggih dari LLM OpenAI. Google menyoroti kemenangan memastikan Gemini di “30 dari 32 benchmark akademis yang banyak digunakan dalam penelitian dan pengembangan jenis bahasa besar (LLM).”
Blog Google termasuk mengimbuhkan uraian deskriptif, dengan video pendukung, berkenaan Gemini yang digunakan untuk tugas-tugas AI tenar layaknya mengimbuhkan wawasan dari berbagai dokumen, memahami berbagai fasilitas (teks, video, audio, dan lainnya), dan juga pengkodean tingkat lanjut.
Gemini tengah diluncurkan saat ini di semua produk dan platform Google. Mulai hari ini, Bard akan menggunakan “versi yang disesuaikan dari Gemini Pro untuk penalaran, perencanaan, pemahaman, dan lainnya yang lebih canggih.” Selain itu, Gemini akan tersedia dalam bahasa Inggris di lebih dari 170 negara dan wilayah.
Gemini Nano akan debut di Google Pixel 8 Pro. Aplikasi layaknya Recorder, G-Board, dan WhatsApp akan langsung mendapatkan akses ke Gemini, dengan pertolongan aplikasi lebih lanjut dalam sebagian bulan mendatang. Terakhir tetapi tidak kalah penting, Gemini termasuk tengah disiapkan untuk diintegrasikan ke dalam Search (SGE), Ads, Chrome, dan Duet AI.
Ikuti berita terkini dari Redaksiku.com di Google News, klik di sini