[논문리뷰] WorldOlympiad: Can Your World Model Survive a Triathlon?본 연구는 기존 세계 모델 평가 방식이 파편화되어 있고 실제 물리적 환경에서의 복합적인 능력을 충분히 측정하지 못한다는 문제의식에서 출발합니다. 현재 대부분의 연구는 특정 태스크에만 최적화되어 있어, 변화하는 환경에서의 일반화(Generalization) 성능이나 복잡한 인과 관계 이해도를 확인하기 어렵습니다.#Review#World Models#Benchmarking#Embodied AI#Generalization#Multimodal Evaluation#Simulator2026년 6월 9일댓글 수 로딩 중