본문으로 건너뛰기

#Multimodal Agent

12개의 포스트

[논문리뷰] WorldMemArena: Evaluating Multimodal Agent Memory Through Action-World Interaction

댓글 수 로딩 중

[논문리뷰] PhoneWorld: Scaling Phone-Use Agent Environments

댓글 수 로딩 중

[논문리뷰] GenEvolve: Self-Evolving Image Generation Agents via Tool-Orchestrated Visual Experience Distillation

댓글 수 로딩 중

[논문리뷰] InterLV-Search: Benchmarking Interleaved Multimodal Agentic Search

댓글 수 로딩 중

[논문리뷰] Unify-Agent: A Unified Multimodal Agent for World-Grounded Image Synthesis

댓글 수 로딩 중

[논문리뷰] Gen-Searcher: Reinforcing Agentic Search for Image Generation

댓글 수 로딩 중

[논문리뷰] Seeing, Listening, Remembering, and Reasoning: A Multimodal Agent with Long-Term Memory

댓글 수 로딩 중