Jina AI resmi merilis jina-VLM, model bahasa-visi (VLM) 2 miliar parameter (2B) terbarunya. Model ini berhasil mencapai kinerja state-of-the-art (SOTA) di antara semua VLM terbuka skala 2B. Keunggulan utamanya terletak pada kemampuan menjawab pertanyaan visual (VQA) dan memahami dokumen dalam berbagai bahasa, menjadikannya alat yang efisien untuk aplikasi AI multibahasa.
Dengan ukuran yang ringkas (2B), jina-VLM menawarkan keseimbangan ideal antara akurasi tinggi dan efisiensi.
Fokus pada Multilingual VQA dan Document Understanding memastikan model ini menjadi pilihan terdepan untuk para pengembang yang mencari VLM terbuka dengan kinerja superior dan sumber daya komputasi yang efisien.