[논문리뷰] Xiaomi-Robotics-0: An Open-Sourced Vision-Language-Action Model with Real-Time Execution본 논문은 대규모 VLA 모델의 높은 추론 지연 시간으로 인한 실시간 로봇 제어의 어려움과, 사전 학습된 VLM의 시각-의미론적 지식 손실(catastrophic forgetting) 문제를 해결하는 것을 목표로 합니다.#Review#Vision-Language-Action (VLA)#Real-Time Robotics#Diffusion Transformer#Flow Matching#Asynchronous Execution#Robot Manipulation#Pre-training#Catastrophic Forgetting2026년 2월 15일댓글 수 로딩 중
[논문리뷰] UFO^3: Weaving the Digital Agent Galaxy이 논문은 대규모 언어 모델(LLM) 기반 에이전트들이 단일 운영체제나 기기에 국한되어 복잡한 크로스-디바이스 워크플로우를 수동으로 처리해야 하는 한계를 극복하는 것을 목표로 합니다.#Review#Multi-Agent Systems#Cross-Device Orchestration#LLM-Powered Agents#Task Constellation#Directed Acyclic Graph (DAG)#Agent Interaction Protocol (AIP)#Fault Tolerance#Asynchronous Execution2025년 11월 17일댓글 수 로딩 중
[논문리뷰] VerlTool: Towards Holistic Agentic Reinforcement Learning with Tool Use논문은 LLM의 독립적인 추론과 상호작용적 에이전트 지능 사이의 격차를 해소하고자 합니다.#Review#Agentic Reinforcement Learning#Tool Use#Large Language Models#Reinforcement Learning from Verifiable Rewards (RLVR)#Asynchronous Execution#Multi-modal AI#Framework2025년 9월 3일댓글 수 로딩 중