본문으로 건너뛰기

#OCR

16개의 포스트

[논문리뷰] DocAtlas: Multilingual Document Understanding Across 80+ Languages

댓글 수 로딩 중

[논문리뷰] TextPecker: Rewarding Structural Anomaly Quantification for Enhancing Visual Text Rendering

댓글 수 로딩 중

[논문리뷰] OCR-Agent: Agentic OCR with Capability and Memory Reflection

댓글 수 로딩 중

[논문리뷰] Typhoon OCR: Open Vision-Language Model For Thai Document Extraction

댓글 수 로딩 중

[논문리뷰] LightOnOCR: A 1B End-to-End Multilingual Vision-Language Model for State-of-the-Art OCR

댓글 수 로딩 중

[논문리뷰] OmniFusion: Simultaneous Multilingual Multimodal Translations via Modular Fusion

댓글 수 로딩 중

[논문리뷰] CHURRO: Making History Readable with an Open-Weight Large Vision-Language Model for High-Accuracy, Low-Cost Historical Text Recognition

댓글 수 로딩 중

[논문리뷰] VisualOverload: Probing Visual Understanding of VLMs in Really Dense Scenes

댓글 수 로딩 중