Zhipu AI rilis GLM-OCR untuk pemahaman dokumen kompleks.
Zhipu AI memperkenalkan GLM-OCR, sebuah model pengenalan karakter optik (OCR) yang dioptimalkan untuk memahami dokumen dengan struktur rumit.
Meskipun hanya memiliki 0,9 miliar parameter, model ini mampu memberikan performa setara standar industri (state-of-the-art) dalam berbagai tolok ukur pengolahan dokumen tingkat tinggi.
Kelebihan utama:
- Efisien namun kuat: Memiliki ukuran model yang kecil (0.9B) namun tetap memberikan hasil berkualitas tinggi.
- Pengenalan rumus dan tabel: Unggul dalam mengenali format matematika kompleks dan struktur tabel yang detail.
- Ekstraksi informasi: Sangat akurat dalam menarik data penting dari dokumen yang tidak terstruktur.
- Akses terbuka: Bobot model (weights) sudah tersedia di Hugging Face untuk digunakan oleh komunitas pengembang.