Sebuah studi baru menunjukkan bahwa chatbot AI populer seperti ChatGPT, Copilot, Gemini, dan Perplexity masih kesulitan menjaga akurasi saat merangkum berita. Dilansir dari Digitaltrends, penelitian yang dilakukan oleh 22 organisasi penyiaran publik internasional, termasuk BBC dan NPR, menemukan masalah serius terkait keandalan chatbot untuk kebutuhan pemberitaan.
Hasil penelitian menunjukkan hampir setengah dari jawaban chatbot (45 persen) memiliki masalah besar. Lebih dari sepertiga (31 persen) bermasalah dalam hal sumber, sementara sekitar 20 persen mengandung kesalahan fakta yang cukup serius. Jurnalis menilai jawaban chatbot berdasarkan akurasi, kejelasan sumber, pemahaman konteks, dan kemampuan membedakan fakta dari opini.
Gemini dari Google tampil paling buruk, dengan 72 persen jawabannya bermasalah dalam hal sumber, sering kali karena salah atribusi atau tidak ada sumber sama sekali. Copilot dari Microsoft berada di posisi kedua terburuk, meski masalahnya tidak sebesar Gemini.
ChatGPT menunjukkan hasil lebih baik dibanding pesaingnya, tetapi tetap memiliki tingkat kesalahan yang perlu diperbaiki. Perplexity menjadi yang terbaik di antara keempat chatbot, meski masih ada ruang untuk peningkatan.
Para peneliti menekankan bahwa chatbot paling kesulitan saat menghadapi berita yang bergerak cepat atau kompleks. Mereka sering gagal membedakan fakta dari opini. Misalnya, ada chatbot yang salah menyebutkan nama pemimpin pemerintah atau pejabat internasional dalam berita terbaru, menunjukkan keterbatasan dalam menangani informasi yang terus berubah.
Organisasi media yang terlibat meminta pemerintah untuk bertindak. Mereka mengingatkan bahwa semakin banyak orang, terutama di bawah usia 25 tahun, mengandalkan chatbot untuk mendapatkan berita. Saat ini, sekitar 7 persen konsumen berita online global menggunakan chatbot, dan angkanya naik menjadi 15 persen di kalangan anak muda.
Sebagai tindak lanjut, organisasi berita meluncurkan kampanye bersama berjudul “Facts In: Facts Out”. Kampanye ini menuntut perusahaan AI lebih bertanggung jawab atas cara produk mereka mengelola dan menyebarkan berita. Pesannya sederhana: jika yang masuk adalah fakta, maka yang keluar juga harus fakta.
Pax Insight
Studi ini menunjukkan bahwa meski teknologi bahasa AI sudah canggih, chatbot masih memiliki keterbatasan sistematis dalam akurasi berita. Masalah muncul karena data latih yang sudah usang, kesulitan menangani berita terbaru dengan konteks cepat berubah, serta kecenderungan “mengarang” atau menyamarkan sumber saat tidak yakin. Hal ini menandakan bahwa model AI saat ini belum bisa diandalkan sebagai sumber berita utama tanpa perbaikan besar dalam arsitektur dan dukungan mekanisme pemeriksaan fakta eksternal.



