[논문리뷰] GameWorld: Towards Standardized and Verifiable Evaluation of Multimodal Game AgentsarXiv에 게시된 'GameWorld: Towards Standardized and Verifiable Evaluation of Multimodal Game Agents' 논문에 대한 자세한 리뷰입니다.#Review#Multimodal Large Language Model#Game Agent#Benchmark#Standardized Evaluation#Computer-Use Agent#Semantic Action Parsing#Outcome-based Evaluation2026년 4월 15일댓글 수 로딩 중
[논문리뷰] InternVL-U: Democratizing Unified Multimodal Models for Understanding, Reasoning, Generation and Editingganlinyang이 arXiv에 게시한 'InternVL-U: Democratizing Unified Multimodal Models for Understanding, Reasoning, Generation and Editing' 논문에 대한 자세한 리뷰입니다.#Review#Unified Multimodal Models#Multimodal Large Language Model#Image Generation#Image Editing#Chain-of-Thought#Data Synthesis#Low-parameter Models2026년 3월 10일댓글 수 로딩 중
[논문리뷰] HyperVL: An Efficient and Dynamic Multimodal Large Language Model for Edge DevicesYuhang Dong이 arXiv에 게시한 'HyperVL: An Efficient and Dynamic Multimodal Large Language Model for Edge Devices' 논문에 대한 자세한 리뷰입니다.#Review#Multimodal Large Language Model#Edge AI#Efficient Inference#Visual Resolution Compressor#Dual Consistency Learning#Vision Transformer#Quantization#Low-Latency2025년 12월 17일댓글 수 로딩 중
[논문리뷰] DentalGPT: Incentivizing Multimodal Complex Reasoning in DentistryYanchao Li이 arXiv에 게시한 'DentalGPT: Incentivizing Multimodal Complex Reasoning in Dentistry' 논문에 대한 자세한 리뷰입니다.#Review#Multimodal Large Language Model#Dental Imaging#Complex Reasoning#Domain Adaptation#Reinforcement Learning#Medical VQA#Dental Healthcare2025년 12월 14일댓글 수 로딩 중
[논문리뷰] HunyuanOCR Technical ReportarXiv에 게시된 'HunyuanOCR Technical Report' 논문에 대한 자세한 리뷰입니다.#Review#Optical Character Recognition#Multimodal Large Language Model#End-to-End Learning#Reinforcement Learning#Document Parsing#Information Extraction#Text Spotting2025년 11월 25일댓글 수 로딩 중