Lab penelitian kecerdasan buatan OpenAI telah merilis GPT-4, versi terbaru dari terobosan sistem AI yang mendukungnya Obrolan GPTyang lebih kreatif, cenderung mengarang fakta, dan tidak terlalu bias dibandingkan pendahulunya.
Menyebutnya sebagai “model kami yang paling kuat dan sesuai,” salah satu pendiri OpenAI Sam Altman mengatakan bahwa sistem baru ini adalah model “multimodal”, yang berarti dapat menerima gambar dan teks sebagai input, memungkinkan pengguna untuk mengajukan pertanyaan tentang gambar . Versi baru dapat menangani input teks yang sangat besar, mengingat dan menanggapi lebih dari 20.000 kata sekaligus, memungkinkan seluruh novel untuk digunakan sebagai prompt.
Model baru tersedia mulai hari ini untuk pengguna ChatGPT Plus, versi berbayar dari chatbot ChatGPT, yang menyediakan beberapa data pelatihan untuk versi terbaru.
OpenAI juga telah bekerja sama dengan mitra komersial untuk menawarkan layanan berbasis GPT-4. Tingkat langganan baru untuk aplikasi pembelajaran bahasa Duolingo, Duolingo Max, kini menawarkan percakapan yang didukung AI kepada pengguna berbahasa Inggris dalam bahasa Prancis atau Spanyol dan dapat menggunakan GPT-4 untuk menjelaskan kesalahan yang telah dibuat oleh pembelajar bahasa. Di ujung lain spektrum, perusahaan pemrosesan pembayaran Stripe menggunakan GPT-4 untuk menjawab pertanyaan dukungan dari pengguna korporat dan menandai penipu potensial di forum dukungan perusahaan.
“Kecerdasan buatan selalu menjadi bagian besar dari strategi kami,” kata Edwin Bodge, manajer produk utama di Duolingo. “Kami menggunakannya untuk mempersonalisasi pelajaran dan menjalankan tes bahasa Inggris Duolingo. Namun ada celah dalam perjalanan pembelajar yang ingin kami isi: praktik percakapan dan umpan balik kontekstual tentang kesalahan.” Eksperimen perusahaan dengan GPT-4 meyakinkannya bahwa teknologi mampu menyediakan fitur ini, dengan “95% ‘dari prototipe diciptakan dalam sehari.
Selama demo GPT-4 pada hari Selasa, Greg Brockman, presiden dan salah satu pendiri Open AI, juga memberikan gambaran kepada pengguna tentang kemampuan pengenalan gambar dari versi terbaru sistem, yang belum tersedia untuk umum dan hanya sedang diuji. oleh sebuah perusahaan bernama Be my eyes Fitur tersebut memungkinkan GPT-4 untuk menganalisis dan menanggapi gambar yang dikirimkan bersama dengan petunjuk dan menjawab pertanyaan atau melakukan tugas berdasarkan gambar tersebut. “GPT-4 bukan hanya model bahasa, tetapi juga model visi,” kata Brockman. “GPT-4 dapat secara fleksibel menerima masukan yang menggabungkan gambar dan teks sesuka hati, seperti dokumen.”
Pada satu titik dalam demo, GPT-4 diminta menjelaskan mengapa gambar tupai dengan kamera itu lucu. (Karena “kami tidak berharap mereka menggunakan kamera atau bertindak seperti manusia.”) Di titik lain, Brockman mengirimkan foto sketsa situs web yang digambar tangan dan belum sempurna ke GPT-4, dan sistem membuat a website kerja berdasarkan Gambar.
OpenAI mengklaim bahwa GPT-4 memperbaiki atau meningkatkan banyak kritik yang dimiliki pengguna dengan versi sistemnya sebelumnya. Sebagai “model bahasa besar”, GPT-4 dilatih dengan sejumlah besar data dari Internet dan mencoba memberikan jawaban atas kalimat dan pertanyaan yang secara statistik mirip dengan yang sudah ada di dunia nyata. Tapi itu bisa berarti mengarang informasi saat mereka tidak tahu jawaban pastinya – masalah yang dikenal sebagai “halusinasi” – atau memberikan tanggapan yang mengganggu atau menyinggung saat diberi petunjuk yang salah.
Dengan membangun percakapan yang dilakukan pengguna dengan ChatGPT, OpenAI dapat memperbaiki — tetapi tidak menghilangkan — kelemahan di GPT-4 ini, menjadi “29% lebih mungkin” untuk menanggapi permintaan konten secara sensitif seperti nasihat medis atau nasihat menyakiti diri sendiri dan salah menanggapi permintaan konten terlarang 82% lebih jarang.
Namun, GPT-4 masih akan “berhalusinasi” fakta, dan OpenAI memperingatkan pengguna: “Saat menggunakan keluaran model bahasa, terutama dalam konteks berisiko tinggi, harus dilakukan dengan protokol yang tepat (mis. verifikasi manusia, membumi dengan konteks tambahan) dengan sangat baik perawatan (atau menghindari aplikasi berisiko tinggi sama sekali) untuk memenuhi kebutuhan kasus penggunaan yang diberikan.” Tetapi kinerjanya “40% lebih baik” pada tes yang mengukur halusinasi, kata OpenAI.
Sistem ini sangat bagus dalam menghindari klise: versi GPT yang lebih lama akan dengan senang hati bersikeras bahwa “Anda tidak dapat mengajari anjing tua trik baru” adalah benar secara faktual, tetapi GPT-4 yang lebih baru akan menjawab pengguna yang bertanya, katakan dengan benar jika Anda bisa mengajari anjing tua trik baru yang mengatakan “ya, kamu bisa”.