← Ana Sayfa

opendataloader-project/opendataloader-pdf

Java ⭐ 15.7k 🍴 1.3k 🔥 +775 today

Orijinal Aciklama

PDF Parser for AI-ready data. Automate PDF accessibility. Open-source.

📄 Apache-2.0
Lisans
39
Açık Issue
1 ay önce
Son Commit
65
İzleyici
a11yaccessibilityaibounding-boxdocument-parsingeaahtmljson

🤖 AI Analizi (Turkce)

OpenDataLoader PDF, PDF dosyalarından yapılandırılmış veri çıkaran ve PDF erişilebilirliğini otomatikleştiren açık kaynaklı bir projedir. Java 11+ sürümü ile çalışır ve Python, Node.js, Java SDK'ları mevcuttur. Proje, PDF'leri Markdown, JSON, HTML, Tagged PDF ve PDF/UA formatlarına dönüştürmeyi destekler.

🎯 Hedef Kitle: PDF veri çıkarma, erişilebilirlik otomasyonu ve yapay zeka uygulamaları geliştiren yazılımcılar ve araştırmacılar

TEMEL OZELLIKLER

  • Benchmarklarda #1 overall extraction accuracy (0.907)
  • 0.928 table extraction accuracy
  • Deterministik local mod + AI hibrit modu
  • Built-in OCR (80+ languages) in hibrit mod
  • LangChain entegrasyonu

💡 Kullanım Örneği

Bir veri bilimcisi, PDF belgelerinden veri çıkarmak için OpenDataLoader PDF'yi kullanabilir. Örneğin, bir araştırma makalesindeki tablo ve grafiklerden veri çıkarmak için projeyi kullanarak Markdown, JSON veya HTML formatında yapılandırılmış veri elde edebilir.

📊 Trend Gecmisi

2026-04-12 Gunluk #10 ⭐ 15.7k
2026-04-11 Gunluk #9 ⭐ 14.9k
2026-04-10 Gunluk #5 ⭐ 14.0k

🔗 Benzer Projeler

anonfaded/FadCam

Open-source, ad-free Android multimedia recorder with background video recording…

Java2.3k
GitHub'da Gor →

💬 Yorumlar