Permasalahan halusinasi pada model bahasa besar (Large Language Models/LLM) masih menjadi tantangan utama yang sulit diatasi seiring dengan meningkatnya kapabilitas teknologi AI. Meskipun model-model saat ini semakin cerdas, kesalahan faktual tetap muncul, sehingga industri terus mencari metode terbaik untuk melakukan verifikasi. Menjawab tantangan tersebut, perusahaan rintisan bernama Probably baru saja mengamankan pendanaan tahap awal (seed funding) sebesar USD 9 juta dari firma modal ventura Andreessen Horowitz.
Fokus utama Probably adalah menciptakan sistem yang lebih ketat dalam mendeteksi dan mencegah kesalahan sebelum hasil AI sampai ke tangan pengguna. Pendiri Probably, Peter Elias, menyatakan bahwa visi perusahaan adalah mencapai tingkat akurasi hingga 99,99 persen. Angka ini lazim ditemukan pada sistem deterministik, namun menjadi tantangan besar dalam ekosistem AI generatif yang bersifat probabilistik.
Produk perdana yang dikembangkan Probably adalah alat sains data yang dirancang untuk memberikan jawaban cepat dari kumpulan data kompleks. Setiap hasil yang diberikan dilengkapi dengan sitasi dan jejak audit yang transparan. Untuk menjaga akurasi, Probably mengimplementasikan sistem yang disebut Elias sebagai "data science mech suit", di mana jawaban awal dari LLM divalidasi secara ketat terhadap data sumber yang ada.
Keunggulan dari sistem ini terletak pada optimasi proses. Elias mengungkapkan bahwa dengan rekayasa sistem pendukung (harness engineering) yang baik, model AI yang digunakan tidak perlu memiliki parameter yang sangat besar. Dengan mempersempit ambiguitas konteks, model AI dapat bekerja lebih efisien tanpa harus mengandalkan model bahasa kelas atas yang membutuhkan daya komputasi masif.
Strategi ini memungkinkan alat sains data milik Probably berjalan pada model AI yang jauh lebih kecil. Bahkan, versi saat ini dapat beroperasi pada perangkat keras lokal seperti komputer desktop, bukan di pusat data (data center). Hal ini memberikan keuntungan signifikan bagi pengguna dalam menekan biaya token yang saat ini terus meningkat seiring dengan tingginya penggunaan infrastruktur AI berbasis awan.
Ke depannya, Elias berencana memperluas cakupan teknologi ini ke sektor-sektor yang sangat sensitif terhadap presisi, seperti akuntansi dan layanan medis. Ia juga mengkritisi model bisnis laboratorium AI besar yang cenderung tidak memprioritaskan akurasi absolut, karena mereka mendapatkan keuntungan setiap kali pengguna harus melakukan koreksi berulang pada model yang salah.