ChatGPT adalah raja? Bagaimana performa chatbot AI gratis terbaik dalam uji lapangan

Sementara ChatGPT OpenAI adalah chatbot berbasis Kecerdasan Buatan (AI) pertama yang memikat dunia setelah dirilis ke publik pada November 2022, berbagai pesaing telah memasuki pasar sejak saat itu.

Raksasa teknologi Google dan Microsoft telah meluncurkan chatbot AI mereka sendiri, dengan Bard Google menghapus daftar tunggu dan membuka ke lebih dari 180 negara dan teritori pada 10 Mei, setelah Microsoft mengalahkannya dan merilis sepenuhnya milik mereka Mesin pencari Bing berdasarkan kecerdasan buatan pada tanggal 4 Mei.

Dengan beberapa chatbots untuk dipilih, Cointelegraph memutuskan untuk menguji beberapa yang paling terkenal untuk melihat mana yang memiliki yang terbaik dalam uji lapangan, serta membandingkan beberapa fitur mereka.

Untuk menguji chatbots, masing-masing ditanyai serangkaian pertanyaan, teka-teki, dan saran yang lebih kompleks untuk menentukan keakuratan dan kecepatan responsnya.

Banyak chatbot AI yang tersedia saat ini didukung oleh template GPT OpenAI. Meskipun chatbot AI ini dapat memberikan hasil yang mirip dengan ChatGPT, pengembang aplikasi juga dapat menambahkan perintah tambahan, yang dapat mengubah hasilnya.

ChatGPT-3.5 oleh OpenAI

Sementara OpenAI telah merilis ChatGPT-4, yang tersedia untuk pengguna paket Plus seharga $20/bulan, ChatGPT-3.5 gratis dan sedang diuji di sini.

ObrolanGPT-4 secara signifikan melampaui pendahulunya dengan kecepatan respons yang lebih cepat, respons yang lebih akurat, dan pengurangan waktu henti server.

Chatbot AI pertama yang menaklukkan dunia dapat membantu tugas-tugas seperti menulis esai, kode debug, dan bahkan keuangan pribadi hanya setelah sekitar satu detik waktu pemrosesan.

Namun, salah satu area di mana ChatGPT berkinerja buruk adalah kurangnya kemampuannya untuk mencari di Internet.

Artinya, model ini hanya sebaik data pelatihan yang dimasukkan ke dalamnya, yang berlangsung hingga September 2021. OpenAI adalah mengimplementasikan plugin yang memungkinkannya menemukan informasi secara online menggunakan Bing Search API, tetapi ini akan terbatas pada pengguna paket Plus.

Terlepas dari kekurangan dalam versi gratis ini, chatbot biasanya masih dapat menyarankan sumber daya untuk membantu pengguna menjawab pertanyaan mereka, sebagaimana dibuktikan dalam interaksi di bawah ini.

Tangkapan layar yang menggambarkan ketidakmampuan ChatGPT-3.5 untuk membicarakan peristiwa terkini. Sumber: Buka AI

ChatGPT-3.5 menjawab sebagian besar teka-teki yang diberikan dengan benar dan semua soal matematika sederhana, tetapi jawaban kurang benar ketika soal yang lebih kompleks ditanyakan.

Misalnya, ketika diminta untuk menyelesaikan persamaan kuadrat 2t^2 + 0,3t – 0,4 = 0, ChatGPT-3.5 mengembalikan jawaban yang benar dalam salah satu dari tiga percobaan dan memiliki masalah serupa mengalikan angka yang lebih besar.

ChatGPT-3.5 juga bisa tidak akurat saat menjawab pertanyaan lain. Menurut tes oleh OpenAI, dia hanya mampu menjawab dengan benar 213 dari 400 pertanyaan di Uniform Bar Exam, yang harus dilalui oleh mahasiswa hukum pascasarjana di Amerika Serikat sebelum mereka dapat menjadi pengacara praktik.

Di luar ketidakakuratan faktual, ChatGPT-3.5 juga berjuang dengan pertanyaan untuk menguji kehebatan logisnya, seperti di bawah ini.

ChatGPT salah menjawab pertanyaan yang ditujukan untuk menguji kapasitas logisnya. Sumber: Buka AI

Bing-nya Microsoft

Bing ChatGPT didasarkan pada model bahasa GPT-4 yang dibuat oleh OpenAI, tetapi kedua chatbot tersebut memiliki beberapa perbedaan utama.

Perbedaan mencolok pertama adalah bahwa chatbot Bing membutuhkan waktu lebih lama untuk menjawab pertanyaan, dengan waktu respons rata-rata sekitar lima detik dibandingkan dengan ChatGPT OpenAI yang hanya membutuhkan satu detik.

Itu juga mengharuskan pengguna untuk menggunakan browser web Microsoft Edge, yang sama sekali tidak mirip populer seperti Google Chrome.

Sisi positifnya, chatbot Bing menggunakan mesin pencari Bing dalam tanggapannya, memungkinkannya untuk menjawab pertanyaan tentang peristiwa terkini, tidak seperti chatbot lain yang menggunakan GPT-4. Saat ini juga tersedia secara gratis.

Itu juga menyediakan sumber untuk tanggapannya, sehingga memudahkan pengguna untuk memverifikasi klaim yang dibuat oleh chatbot.

Bing ChatGPT dari Microsoft beraksi. Sumber: Bing

Menggunakan persamaan kuadrat yang sama 2t^2 + 0,3t – 0,4 = 0, Bing ditautkan ke Microsoft Math Solver tetapi sering memberikan jawaban yang salah dan memiliki masalah serupa dalam menjawab perkalian yang lebih besar dengan benar.

Dalam pertanyaan logis yang sama tentang bookmark yang ditempatkan di ChatGPT-3.5, Bing menjawab dengan benar bahwa Anda akan melihat bookmark di halaman 120.

penyair Google

Google baru-baru ini merilis chatbot AI bernama Bard, yang berjalan pada model bahasa PaLM 2-nya.

Seperti yang ditunjukkan oleh penggemar AI Moritz Kremb di utas Twitter, itu dapat membalas dan diminta dengan gambar, mendukung banyak bahasa pemrograman, dan, seperti Bing chatbot, dapat terhubung ke Internet.

Ketika ditanya bagaimana perbandingan PaLM 2 dengan GPT-4, Bard mengatakan bahwa GPT-4 lebih baik dalam pembuatan teks, tetapi PaLM 2 lebih baik dalam penalaran dan logika, menambahkan:

“Pada akhirnya, model bahasa terbaik untuk Anda bergantung pada kebutuhan Anda. Jika Anda membutuhkan LLM yang kuat dalam penalaran dan logika, maka Palm 2 adalah pilihan terbaik Anda. Jika Anda membutuhkan LLM yang cepat, bagus dalam menghasilkan teks dan telah terbukti, maka GPT-4 adalah pilihan terbaik.”

Bard menjawab pertanyaan bookmark dengan benar dan menjelaskan jawabannya lebih mendalam daripada Bing, tetapi penjelasannya seringkali tidak masuk akal.

Terkait: Apa itu Google Bard dan bagaimana cara kerjanya?

Dia memecahkan sebagian besar teka-teki yang diberikan dan melakukannya dengan baik dengan pertanyaan matematika, memecahkan pertanyaan perkalian kompleks dan persamaan kuadrat dengan benar dalam dua dari tiga draf jawaban yang dia siapkan.

YouChat

Meskipun juga menggunakan GPT-3.5 OpenAI, ada beberapa perbedaan antara YouChat You.com dan ChatGPT OpenAI.

Itu mencantumkan sumber untuk sebagian besar teks yang dihasilkannya dan juga menyediakan tautan ke beberapa halaman web yang terkait dengan kueri.

Itu juga terhubung ke internet, memungkinkannya mengakses acara terkini, dan karena tidak memiliki tingkat popularitas yang sama dengan chatbot OpenAI, waktu henti tidak menjadi masalah.

Dia menjawab salah baik pertanyaan bookmark, persamaan kuadrat dan masalah perkalian yang lebih kompleks.

Dia mampu memecahkan sebagian besar teka-teki yang diberikan kepadanya, tetapi menjawab beberapa dengan salah.

HugsChat

HuggingChat adalah open source AI chat dari perusahaan AI Hugging Face, dirilis pada bulan April.

Ketika diminta untuk memecahkan persamaan kuadrat yang sama, HuggingChat mengembalikan 684 kata teks dan gagal memberikan jawaban atas pertanyaan tersebut. Meskipun bisa menjawab masalah sederhana dengan benar, itu tidak bisa mengalikan angka yang lebih besar.

Meskipun kadang-kadang memberikan jawaban langsung, HuggingChat sering mengembalikan dinding teks yang besar, yang awalnya relevan tetapi berubah menjadi sesuatu yang mirip dengan bertele-tele.

Misalnya, dia diminta memecahkan teka-teki berikut: “Satu tong berisi air beratnya 60 pon. Seseorang memasukkan sesuatu ke dalamnya dan sekarang beratnya 40lbs. Apa yang ditambahkan orang itu?”

Jawaban yang benar adalah sebuah lubang, tetapi HuggingChat menjawab es batu sebelum meluncurkan monolog 545 kata.

Dan sisanya?

Ada banyak chatbot AI lain yang tersedia saat ini, dirancang untuk kasus penggunaan yang lebih terbatas daripada yang disebutkan di sini, dengan pasar yang cenderung terus berkembang pesat.

Misalnya, Socrates adalah chatbot AI lain dari Google yang dapat diunduh ke ponsel cerdas untuk membantu pengguna menjawab pertanyaan tentang sains, matematika, sastra, dan lainnya. Ini juga memberikan penjelasan visual tentang konsep dalam mata pelajaran yang berbeda dan merupakan alat yang berguna untuk membantu pembelajaran.

DeepAI adalah chatbot AI yang berspesialisasi dalam menulis teks seperti kode pemrograman, puisi, cerita, atau esai.

Kesimpulan

Meskipun mungkin tidak adil untuk membandingkan ChatGPT-3.5 OpenAI dengan chatbot AI Bing, karena mereka menggunakan model bahasa yang berbeda, artikel ini hanya akan membahas chatbot AI yang tersedia secara gratis.

Melalui Bing, pengguna dapat memanfaatkan model bahasa ChatGPT-4 OpenAI, yang merupakan peningkatan besar dibandingkan pendahulunya.

Meskipun Google Bard menjanjikan, Bing secara umum melakukan yang terbaik dari chatbot AI yang tersedia secara gratis saat ini, tetapi masih membuat beberapa kesalahan.

Chatbots lain tampaknya memiliki kasus penggunaan yang lebih terbatas yang bisa lebih berguna, tetapi ketiganya tampaknya memimpin seiring kemajuan pengembangan.

Majalah: Kecanduan perdagangan Cryptocurrency: apa yang harus diwaspadai dan bagaimana penanganannya

Hal tersebut di atas merupakan uji lapangan informal dari beberapa solusi AI dan sama sekali tidak lengkap atau mewakili posisi Cointelegraph pada solusi AI tertentu.