#Policy Composition

2개의 포스트

[논문리뷰] Dynamic Latent Routing

본 연구는 LLM의 post-training 과정에서 기존 discrete latent 주입 방식이 갖는 구조적 파괴와 학습 단계의 비효율성을 해결하고자 합니다.

#Review #Dynamic Latent Routing #Markov Decision Processes #General Dijkstra Search #Language Model #Representation Engineering #Policy Composition

2026년 5월 14일

[논문리뷰] Compose Your Policies! Improving Diffusion-based or Flow-based Robot Policies via Test-time Distribution-level Composition

본 논문의 핵심 목표는 추가적인 모델 훈련 없이 확산(diffusion) 또는 플로우(flow) 기반 로봇 정책의 성능을 향상시키는 것입니다.

#Review #Diffusion Models #Flow-based Models #Robotics Control #Policy Composition #Test-time Optimization #Score-based Models #Training-free

2025년 10월 6일