[논문리뷰] PianoKontext: Expressive Performance Rendering from Deadpan Context본 논문은 기존의 음악 생성 모델이 표현적 타이밍(Expressive timing)과 다성 음악(Polyphonic music)의 복잡성을 제대로 모델링하지 못하는 문제를 해결하기 위해 PianoKontext를 제안한다.#Review#Expressive Performance Rendering#Flow Matching#Latent Diffusion#Dynamic Time Warping#Music2Latent#DiT#RoPE2026년 6월 11일댓글 수 로딩 중
[논문리뷰] NaviTrace: Evaluating Embodied Navigation of Vision-Language Models본 논문은 Vision-Language Models (VLMs)의 실제 환경 내 로봇 내비게이션 능력 을 평가하기 위한 새로운 벤치마크 NaviTrace를 제안합니다.#Review#Vision-Language Models#Embodied Navigation#VQA Benchmark#Robotic Navigation#Semantic-aware Score#Dynamic Time Warping#Real-world Scenarios2025년 11월 9일댓글 수 로딩 중
[논문리뷰] MOSS-ChatV: Reinforcement Learning with Process Reasoning Reward for Video Temporal Reasoning비디오 기반 MLLM(Multimodal Large Language Models)에서 발생하는 프로세스 불일치(process inconsistency) 문제를 해결하여, 모델이 올바른 최종 답변을 도출하더라도 중간 추론 과정이 비디오의 시간적 역동성에서 벗어나는 한계를 극복하는 것을 목표로 합니다.#Review#Video Temporal Reasoning#Reinforcement Learning#Process Supervision#Dynamic Time Warping#Multimodal Large Language Models#Video State Prediction#Reward Hacking2025년 9월 26일댓글 수 로딩 중
[논문리뷰] LayerD: Decomposing Raster Graphic Designs into Layers본 논문은 합성된 래스터 그래픽 디자인 이미지에서 레이어 정보를 복원하여 디자이너가 편집하기 어려운 문제를 해결하고자 합니다. 래스터 그래픽 디자인을 재편집 가능한 레이어 시퀀스로 자동 분해함으로써, 기존 래스터 아트워크 자산을 활용하여 새로운 아트워크를 생성하는 창의적인 워크플로우를 가능하게 하는 것을 목표로 합니다.#Review#Graphic Design#Image Decomposition#Layer Extraction#Image Matting#Background Completion#Deep Learning#Creative AI#Dynamic Time Warping2025년 10월 1일댓글 수 로딩 중