LMSYS Chatbot Arena kini dukung unggah dokumen PDF.
Chatbot Arena resmi meluncurkan fitur unggah berkas PDF untuk memperkaya konteks dalam pengujian model AI.
Fitur ini memungkinkan pengguna untuk mengevaluasi kemampuan penalaran dokumen pada berbagai model bahasa besar (LLM) secara langsung, sehingga hasil penilaian menjadi lebih relevan dengan penggunaan di dunia nyata.
Poin penting dan kelebihan:
- Uji penalaran dokumen: Pengguna dapat menguji seberapa baik model dalam memahami isi dokumen teknis yang kompleks.
- Interaksi langsung: Memungkinkan pengajuan pertanyaan spesifik yang jawabannya bersumber langsung dari berkas yang diunggah.
- Analisis cepat: Mampu menghasilkan ringkasan dan poin-poin penting dari dokumen panjang hanya dalam hitungan menit.
- Dukungan multi-model: Saat ini sudah dapat diuji pada 10 model pilihan, dengan rencana penambahan model lebih banyak di masa mendatang.
- Papan peringkat segera hadir: Data hasil perbandingan dari unggahan PDF ini akan segera ditampilkan dalam papan peringkat (leaderboard) khusus.
Pembaruan ini bertujuan untuk memberikan standar evaluasi yang lebih ketat bagi pengembang AI dalam menangani data tidak terstruktur seperti dokumen resmi.