[논문리뷰] JAMER: Project-Level Code Framework Dataset and Benchmark on Professional Game Engines본 논문은 프로페셔널 게임 엔진 환경에서 프로젝트 레벨의 코드 프레임워크를 생성하고 평가하는 AI 기술의 부재를 해결하고자 한다 . 기존 연구들은 주로 단일 파일 생성이나 간단한 게임 로직에 국한되어 있으며, 게임의 복잡한 런타임 행동을 정량적으로 평가할 수 있는 방법론이 부족하였다.#Review#Game Engine#Code Framework#Software Engineering#Benchmark#Dataset#Godot#Deterministic Evaluation2026년 6월 18일댓글 수 로딩 중
[논문리뷰] GameCraft-Bench: Can Agents Build Playable Games End-to-End in a Real Game Engine?본 논문은 현대의 Coding Agent가 자연어 명세(Specification)를 실제 실행 가능한 게임으로 변환하는 End-to-End 생성 능력을 엄밀하게 평가하고자 합니다.#Review#Game Generation#Coding Agents#Game Engine#Godot#End-to-End Evaluation#Interactive Verification#Benchmark2026년 6월 16일댓글 수 로딩 중