[논문리뷰] MMSkills: Towards Multimodal Skills for General Visual Agents본 논문은 시각적 에이전트가 복잡한 환경에서 성공적인 결정을 내리기 위해 필요한 Multimodal Procedural Knowledge의 부재 문제를 해결하고자 합니다.#Review#Multimodal Agents#Procedural Knowledge#Visual Grounding#Branch Loading#GUI Agents#Skill Representation2026년 5월 17일댓글 수 로딩 중