Google Gemini, Platform Kecerdasan Buatan Generatif Baru

Wecome Mahavision di Website Kami! Sambut Harbolnas, Zulhas Jadi Host Shopee Live Bersama Seller UMKM Ekspor

Mahavision Tekno – Google mencoba membuat gebrakan dengan Gemini, platform AI yang baru saja diluncurkan. Gemini adalah rangkaian model AI sintetik terbaru Google, yang dikembangkan oleh laboratorium penelitian AI Google, DeepMind, dan Google Research. Muncul dalam tiga varian: – Gemini Ultra, model teratas Gemini – Gemini Pro, versi “lite” dari model Gemini – Gemini Nano, model lebih kecil yang berfungsi pada perangkat seluler seperti Pixel 8 Pro. Dengan kata lain, semua model Gemini dilatih untuk menjadi “secara inheren multimodal”, agar mampu bekerja dan menggunakan lebih dari sekadar teks. Mereka telah dilatih sebelumnya dan disempurnakan dalam berbagai jenis file audio, gambar, video, serta kumpulan kode sumber besar dan skrip dalam berbagai bahasa. Inilah yang membedakan Gemini dari model lain seperti LaMDA, model bahasa besar Google, yang hanya dilatih pada data teks. LaMDA tidak dapat memahami atau menghasilkan apa pun selain teks (misalnya artikel, draf email, dll.), namun hal ini tidak berlaku pada model Gemini. Kemampuan mereka untuk memahami gambar, suara, dan modalitas lainnya terbatas, namun ada sesuatu yang lebih baik daripada tidak sama sekali. Apa perbedaan antara Bard dan Gemini? Dari dingin. Bard hanyalah sebuah antarmuka yang melaluinya beberapa model Gemini dapat diakses, anggap saja sebagai aplikasi atau klien untuk model Gemini dan model kecerdasan buatan umum (gen Siapa pun. Di sisi lain, Gemini adalah sekelompok templat, bukan aplikasi atau antarmuka pengguna. Tidak ada pengalaman independen di Gemini, dan mungkin tidak akan pernah ada. Jika dibandingkan dengan produk OpenAI, Bard setara dengan ChatGPT, implementasi AI percakapan OpenAI yang populer, dan Gemini setara dengan model bahasa yang dijalankannya, yang dalam kasus ChatGPT adalah GPT-3.5 atau 4. Artikel Diragukan bahwa Gemini juga sepenuhnya independen produk OpenAI. Imagen-2, model teks-ke-gambar yang mungkin cocok atau tidak sesuai dengan strategi AI perusahaan secara keseluruhan. Jangan khawatir, Anda bukan satu-satunya yang bingung dengan hal ini! Apa yang bisa dilakukan Gemini? Karena Gemini adalah orang-orang multimedia, mereka pada dasarnya dapat melakukan berbagai tugas, mulai dari menulis surat, memberi teks pada foto dan video, hingga memproduksi karya seni. Beberapa dari kemampuan ini telah mencapai tahap produk (kita akan membicarakannya secara lebih rinci nanti), namun Google menjanjikan semua kemampuan tersebut dan lebih banyak lagi, pada suatu saat di masa depan. Google sangat mengecewakan dengan peluncuran Bard asli. Baru-baru ini, mereka membuat heboh dengan sebuah video yang konon menunjukkan kemampuan Gemini yang sangat karismatik dan lebih ambisius. Memang benar, Gemini tersedia dalam beberapa bentuk, namun dalam bentuk yang agak terbatas, namun, selama Google cukup jujur ​​dengan klaimnya, inilah yang dapat dilakukan oleh berbagai level model Gemini setelah dirilis: Gemini UltraOnly sejumlah pelanggan terpilih yang terbatas Banyak aplikasi dan layanan Google memiliki akses ke Gemini Ultra, model “dasar” yang mendasari model lainnya. Situasi ini tidak akan berubah hingga akhir tahun, ketika Google berencana meluncurkan model terbesarnya dalam skala yang lebih besar. Sebagian besar informasi tentang Ultra berasal dari demo produk yang dipimpin Google, jadi Anda harus berhati-hati. Google mengklaim Gemini Ultra dapat digunakan untuk membantu berbagai hal, seperti menyelesaikan pekerjaan rumah fisika dan menyelesaikan latihan langkah demi langkah. – Memecahkan masalah pada latihan, menyoroti kemungkinan kesalahan dalam jawaban yang telah diselesaikan. Gemini Ultra juga dapat diterapkan pada tugas lain, seperti mengidentifikasi artikel ilmiah yang berkaitan dengan suatu masalah, mengekstraksi informasi dari artikel tersebut, dan “memperbarui” grafik dari artikel dengan membuat rumus yang diperlukan untuk membuat bagan tersebut dengan data yang lebih terkini. Dari segi perspektif, Gemini Ultra mendukung pembuatan gambar seperti yang disebutkan sebelumnya. Namun, menurut pernyataan Google, kemampuan ini tidak akan diterapkan pada model versi produk saat diluncurkan, mungkin karena mekanismenya lebih kompleks daripada cara aplikasi seperti ChatGPT menghasilkan gambar. Sebaliknya, Gemini menciptakan gambaran “secara alami” tanpa mengalaminya. Langkah perantara, tidak seperti aplikasi seperti ChatGPT yang menggunakan generator gambar seperti DALL-E 3. Di sisi lain, Gemini ProGemini Pro kini tersedia untuk umum. Namun, dalam konteks yang membingungkan, kemampuannya bergantung pada tempat penggunaannya. Google mengklaim bahwa di Bard, tempat Gemini Pro pertama kali diluncurkan dalam bentuk teks saja, model tersebut memberikan peningkatan dalam penalaran, perencanaan, dan pemahaman dibandingkan dengan LaMDA. Sebuah studi independen yang dilakukan oleh para peneliti dari Carnegie Mellon dan BerriAI menunjukkan bahwa Gemini Pro sebenarnya mengungguli OpenAI GPT-3.5 dalam menangani rantai penalaran yang lebih panjang dan kompleks. Dalam permasalahan yang melibatkan banyak angka, pengguna menemukan banyak contoh kesalahan penalaran dan faktual. Model sering kali membuat kesalahan sederhana, bahkan pada pertanyaan yang dianggap mudah seperti pertanyaan pemenang Oscar terbaru. Google telah berjanji untuk memperbaiki masalah ini tetapi tidak jelas kapan perbaikan tersebut akan diterapkan. Gemini Pro juga dapat diakses melalui API di Vertex AI, sebuah platform pengembangan AI yang sepenuhnya dikelola oleh Google. Titik akhir tambahan, Gemini Pro Vision, mampu memproses teks dan gambar, termasuk gambar dan video, serta menghasilkan teks selain model GPT-4 OpenAI dengan Vision. Di Vertex AI, pengembang dapat menyesuaikan Gemini Pro untuk konteks dan kasus penggunaan yang berbeda dengan menyesuaikan proses atau “landasan”. Gemini Pro juga dapat memanggil API eksternal untuk melakukan tindakan tertentu, dan sekitar “awal tahun 2024,” pelanggan Vertex akan dapat menggunakan Gemini Pro untuk menjalankan percakapan yang dibuat khusus oleh agen suara dan game (yaitu chatbot). Selain itu, Gemini Pro juga akan menjadi opsi untuk memanfaatkan fitur ringkasan pencarian, rekomendasi, dan pembuatan jawaban Vertex AI dengan mengambil informasi dari dokumen multimedia (seperti PDF dan gambar) dari berbagai sumber (seperti OneDrive dan Salesforce). Untuk memenuhi persyaratan. Di AI Studio, alat berbasis web Google untuk pengembang aplikasi dan platform, alur kerja tersedia untuk membuat perintah percakapan terstruktur, gratis dengan Gemini Pro. Pengembang memiliki akses ke kedua titik akhir, Gemini Pro dan Gemini Pro Vision, dan dapat menyesuaikan suhu model untuk mengontrol kreativitas keluaran dan pembuatan versi untuk memberikan panduan gaya dan desain serta menyesuaikan pengaturan keamanan. Gemini NanoGemini Nano, adalah versi Gemini yang lebih kecil dan lebih canggih Model Pro dan Ultra, cukup kuat untuk dijalankan langsung di (beberapa) ponsel, menggantikan karena mengirimkan tugas ke server di suatu tempat. Sejauh ini, Gemini Nano digunakan untuk mendukung dua fitur di Pixel 8 Pro: “Ringkasan” di aplikasi Memo Suara dan “Umpan Balik Cerdas” di Gboard. Aplikasi Perekam Suara memungkinkan pengguna menekan tombol untuk merekam dan menyalin audio. merangkum rekaman percakapan, wawancara, presentasi, dan foto. Pengguna dapat menerima ringkasan meskipun tidak ada sinyal atau koneksi Wi-Fi. Ramalan Horoskop Selasa 13 Februari 2024 Taurus: Pacarmu punya rencana menarik hari ini Ramalan Horoskop Selasa 13 Februari 2024 Taurus, pasanganmu punya rencana menarik malam ini. Gemini, hindari meminjamkan uang kepada siapa pun. Mahavision 13 Februari 2024 Google Gemini, Platform Kecerdasan Buatan Generatif Baru

Google Gemini, Platform Kecerdasan Buatan Generatif Baru