[논문리뷰] InterleaveThinker: Reinforcing Agentic Interleaved Generation본 논문은 기존의 Unified Multimodal Models(UMMs)가 장기 시퀀스 생성 과정에서 겪는 Visual Over-reliance와 Step-wise Error Accumulation 문제를 해결하기 위해 고안되었습니다.#Review#Interleaved Generation#Multi-Agent Framework#Reinforcement Learning#GRPO#Visual Over-reliance#Error Accumulation2026년 6월 11일댓글 수 로딩 중