Headline
Bukan saat yang tepat menaikkan iuran JKN ketika kondisi ekonomi masyarakat masih hadapi tekanan.
Bukan saat yang tepat menaikkan iuran JKN ketika kondisi ekonomi masyarakat masih hadapi tekanan.
Kumpulan Berita DPR RI
MAKALAH penelitian terbaru dari OpenAI secara teliti mendiagnosis mengapa ChatGPT dan Model Bahasa Besar (LLM) lainnya secara meyakinkan menciptakan kepalsuan. Fenomena yang dikenal sebagai "halusinasi AI."
Makalah ini tidak hanya menjelaskan masalahnya. Makalah ini juga menunjukkan mengapa halusinasi ini mungkin tak terhindarkan secara matematis dan sulit diperbaiki, setidaknya untuk aplikasi konsumen.
Halusinasi: Kesalahan yang Tak Terelakkan
OpenAI memberikan penjelasan matematis paling rinci hingga saat ini mengenai mengapa model AI yakin akan kepalsuan. Mereka menunjukkan bahwa halusinasi bukan sekadar efek samping yang tidak diinginkan dari pelatihan AI, tetapi merupakan konsekuensi logis.
Fakta Menarik: Semakin jarang suatu fakta terlihat dalam data pelatihan, semakin besar kemungkinan AI berhalusinasi. Contohnya, ketika ditanya ulang tahun Adam Kalai (salah satu penulis makalah), DeepSeek-V3 dengan yakin memberikan tiga tanggal yang salah dalam percobaan terpisah.
Yang lebih meresahkan adalah analisis mengapa halusinasi tetap ada meskipun sudah ada upaya perbaikan pasca-pelatihan (seperti umpan balik manusia yang ekstensif).
Para penulis menguji 10 tolok ukur (benchmark) AI utama dan menemukan sembilan di antaranya menggunakan sistem penilaian biner. Mereka memberikan poin nol jika AI mengekspresikan ketidakpastian ("Saya tidak tahu").
Hal ini menciptakan "epidemi" pemberian sanksi pada respons yang jujur. Karena skor untuk mengatakan "Saya tidak tahu" sama dengan memberikan jawaban yang sepenuhnya salah, strategi optimal bagi AI adalah selalu menebak. Para peneliti membuktikan secara matematis bahwa skor yang diharapkan untuk menebak selalu melebihi skor untuk tidak menjawab dalam evaluasi biner semacam itu.
Perbaikan yang diusulkan OpenAI adalah meminta AI untuk mempertimbangkan tingkat keyakinannya sendiri terhadap suatu jawaban sebelum merespons. Tolok ukur juga harus menilai jawaban berdasarkan tingkat keyakinan ini.
Dengan ambang batas keyakinan yang tepat, AI akan secara alami memilih untuk mengekspresikan ketidakpastian daripada menebak, sehingga mengurangi halusinasi.
Perbaikan ini datang dengan konsekuensi besar bagi pengalaman pengguna. Jika ChatGPT mulai mengatakan "Saya tidak tahu" untuk 30% kueri, pengguna yang terbiasa dengan jawaban meyakinkan akan segera meninggalkan sistem tersebut.
Ini mirip dengan proyek kualitas udara yang disebutkan dalam naskah: pengguna cenderung tidak terlibat ketika layar menampilkan ketidakpastian, meskipun pembacaan yang tampak "akurat" terbukti salah.
Selain masalah kepuasan pengguna, ada kendala yang lebih besar: ekonomi komputasional.
Model bahasa yang sensitif terhadap ketidakpastian memerlukan komputasi yang jauh lebih besar daripada pendekatan saat ini, karena mereka harus mengevaluasi banyak kemungkinan respons dan memperkirakan tingkat keyakinan untuk setiap jawaban. Untuk sistem yang memproses jutaan kueri harian, hal ini berarti biaya operasional yang jauh lebih tinggi.
Pendekatan seperti active learning (di mana AI mengajukan pertanyaan klarifikasi) dapat meningkatkan akurasi, tetapi melipatgandakan kebutuhan komputasi.
Meskipun layak dalam domain khusus seperti desain chip atau diagnostik medis (di mana biaya kesalahan sangat mahal), aspek ekonomi ini menjadi mahal untuk aplikasi konsumen yang mengharapkan respons instan.
Makalah OpenAI secara tidak sengaja menyoroti fakta yang tidak mengenakkan: insentif bisnis yang mendorong pengembangan AI konsumen pada dasarnya belum selaras dengan upaya pengurangan halusinasi.
Hingga insentif ini berubah, dan biaya komputasi turun secara signifikan, halusinasi akan tetap menjadi fitur yang tak terhindarkan dalam pengalaman AI konsumen. (Live Sciences/Z-2)
OpenAI meluncurkan serangkaian panduan berupa prompt praktis yang dirancang untuk membantu pengguna mengelola keseharian mereka agar tetap terarah selama bulan Ramadan.
Data terbaru menunjukkan penurunan signifikan pendaftaran mahasiswa baru di jurusan tersebut, justru di saat minat kuliah secara nasional sedang meningkat.
Doubao 2.0 hadir dalam dua varian: versi Reguler dan versi Pro. Versi Pro dirancang khusus untuk menangani penalaran rumit dan eksekusi tugas bertahap (multi-step).
Sedang viral! Tren Caricature of Me and My Job bikin karikatur profesi pakai ChatGPT. Ini cara mudah dan prompt yang dipakai.
Individu yang menggunakan chatbot AI setiap hari memiliki risiko sekitar 30% lebih tinggi mengalami depresi tingkat sedang atau lebih berat.
Guru dan pakar peringatkan "erosi" kemampuan mengeja pada siswa. Penggunaan autocorrect dan ChatGPT disebut memperparah penurunan literasi dasar.
Setiap model memiliki kemampuan berbeda. Mengambil contoh dari Chat-GPT, model terbaru dari AI ini, yaitu GPT-4 atau GPT-5 memiliki tingkat akurasi lebih tinggi
AI seperti ChatGPT, Copilot, dan Google Gemini kini membantu banyak orang merencanakan liburan. Namun, tak jarang muncul “halusinasi” yang menyesatkan.
Fenomena halusinasi AI, di mana kecerdasan buatan menghasilkan informasi salah, menjadi perhatian serius seiring makin canggihnya model AI.
Copyright @ 2026 Media Group - mediaindonesia. All Rights Reserved