Orijinal Aciklama
OCR model that handles complex tables, forms, handwriting with full layout.
🤖 AI Analizi (Turkce)
Bu GitHub reposu, Datalab'ın Chandra OCR 2 modelini içerir. Bu model, görüntüleri ve PDF'leri yapılandırılmış HTML, Markdown veya JSON'a dönüştürerek düzen bilgilerini korur. Model, 90'dan fazla dili destekler, el yazısı, formlar, tablolar, matematik ve karmaşık düzenlerle iyi performans gösterir.
🎯 Hedef Kitle: Python geliştiricileri, OCR (Optik Karakter Tanıma) teknolojisiyle ilgilenenler, belge işleme ve otomatizasyon uzmanları
TEMEL OZELLIKLER
- State-of-the-art OCR modeli
- 90'dan fazla dil desteği
- El yazısı, formlar, tablolar, matematik ve karmaşık düzenlerle iyi performans
- Görüntüleri ve PDF'leri yapılandırılmış HTML, Markdown veya JSON'a dönüştürme
- İki çıkarım modu: yerel (HuggingFace) ve uzak (vLLM sunucu)