[논문리뷰] WBench: A Comprehensive Multi-turn Benchmark for Interactive Video World Model Evaluation최근 Interactive World Models의 발전에도 불구하고, 기존의 평가 방식은 단편적이며 체계적인 평가를 위한 통합된 표준이 부재하다.#Review#Interactive World Models#Video Generation#Benchmark#Multi-turn Interaction#Evaluation Metrics2026년 5월 25일댓글 수 로딩 중
[논문리뷰] A Benchmark for Interactive World Models with a Unified Action Generation Framework본 논문은 대규모 데이터셋과 통합된 벤치마크의 부재로 인해 interactive world model의 물리적 상호작용 능력을 객관적으로 평가하기 어렵다는 문제를 해결하고자 합니다.#Review#Interactive World Models#Benchmark#Action Generation Framework#Embodied Intelligence#Trajectory Following#Memory Ability2026년 5월 5일댓글 수 로딩 중
[논문리뷰] WorldMark: A Unified Benchmark Suite for Interactive Video World Models저자들은 Interactive I2V 모델들을 위한 최초의 표준화된 벤치마크인 WorldMark를 제안합니다. 이 프레임워크의 핵심은 모델별 제어 방식을 WASD 표준 액션으로 변환하는 Unified Action-mapping Adapter를 통해 6개 주요 모델을 동일 조건에서 비교하는 것입니다.#Review#Interactive World Models#Image-to-Video#Benchmark#Unified Control Interface#World Consistency#Cross-Model Evaluation2026년 4월 23일댓글 수 로딩 중