본문으로 건너뛰기

#Large Multimodal Models

14개의 포스트

[논문리뷰] Large Multimodal Models as General In-Context Classifiers

댓글 수 로딩 중

[논문리뷰] From Blind Spots to Gains: Diagnostic-Driven Iterative Training for Large Multimodal Models

댓글 수 로딩 중

[논문리뷰] Scientific Image Synthesis: Benchmarking, Methodologies, and Downstream Utility

댓글 수 로딩 중

[논문리뷰] MMDeepResearch-Bench: A Benchmark for Multimodal Deep Research Agents

댓글 수 로딩 중

[논문리뷰] Video-R4: Reinforcing Text-Rich Video Reasoning with Visual Rumination

댓글 수 로딩 중

[논문리뷰] OpenMMReasoner: Pushing the Frontiers for Multimodal Reasoning with an Open and General Recipe

댓글 수 로딩 중

[논문리뷰] Morae: Proactively Pausing UI Agents for User Choices

댓글 수 로딩 중

[논문리뷰] SciVideoBench: Benchmarking Scientific Video Reasoning in Large Multimodal Models

댓글 수 로딩 중

[논문리뷰] KORE: Enhancing Knowledge Injection for Large Multimodal Models via Knowledge-Oriented Augmentations and Constraints

댓글 수 로딩 중