[논문리뷰] Skill0.5: Joint Skill Internalization and Utilization for Out-of-Distribution Generalization in Agentic Reinforcement Learning본 논문은 에이전트의 효율적인 기술 습득과 OOD 환경에서의 범용성 확보를 위해 기술의 종류에 따른 차별화된 처리(Differentiated Treatment)가 필요함을 제기한다.#Review#Agentic Reinforcement Learning#Skill Internalization#Out-of-Distribution Generalization#Difficulty-Aware Routing#Privileged Distillation#Shortcut Learning2026년 5월 28일댓글 수 로딩 중
[논문리뷰] Chartographer: Counterfactual Chart Generation for Evaluating Vision-Language Models본 논문은 기존의 Chart QA 벤치마크가 VLM의 진정한 시각적 추론 능력을 정확히 측정하지 못하고, 단순한 시각적 패턴 매칭이나 사전 학습된 파라메트릭 지식에 의한 '지름길(Shortcut)'을 활용하고 있다는 문제를 제기합니다.#Review#Vision-Language Models#Chart QA#Counterfactual Generation#Visual Reasoning#Shortcut Learning#Generalization2026년 5월 27일댓글 수 로딩 중
[논문리뷰] The Scaling Properties of Implicit Deductive Reasoning in Transformers본 논문은 depth-bounded Transformer가 내재적(implicit)으로 수행하는 연역적 추론의 확장성(scaling) 한계를 규명합니다.#Review#Transformers#Implicit Deductive Reasoning#Horn Clauses#Chain-of-Thought#Scaling Properties#Shortcut Learning#Algorithmic Alignment2026년 5월 7일댓글 수 로딩 중
[논문리뷰] Chain-of-Thought Degrades Visual Spatial Reasoning Capabilities of Multimodal LLMs저자들은 다양한 규모의 MRM 및 MLM 백본을 대상으로 CoT와 Non-CoT 프롬프트를 비교 평가하는 방법론을 수행하였습니다. 실험 결과, 17개 중 대다수의 모델에서 CoT 프롬프트를 사용했을 때 시각적 공간 추론 정확도가 평균적으로 하락하는 경향이 관찰되었습니다 .#Review#Multimodal Reasoning Models#Chain-of-Thought#Visual Spatial Reasoning#Shortcut Learning#Hallucination#No-Image Ablation2026년 4월 21일댓글 수 로딩 중
[논문리뷰] Shortcut Learning in Generalist Robot Policies: The Role of Dataset Diversity and Fragmentation본 논문은 일반 로봇 정책의 제한된 일반화 능력의 근본 원인을 규명하고자 합니다. 특히, 태스크와 관련 없는 특징에 의존하는 숏컷 학습(shortcut learning)이 일반화의 주요 장애물인지 조사합니다.#Review#Robot Learning#Generalization#Shortcut Learning#Dataset Diversity#Dataset Fragmentation#Data Augmentation#Imitation Learning2025년 8월 12일댓글 수 로딩 중
[논문리뷰] Fidelity-Aware Data Composition for Robust Robot Generalization본 논문은 대규모 시각적으로 균질한 데이터셋으로 훈련된 로봇 정책이 Shortcut Learning 에 취약하여 Out-of-Distribution (OOD) 일반화 가 저해되는 문제를 해결하고자 합니다.#Review#Robot Generalization#Data Augmentation#Out-of-Distribution (OOD)#Shortcut Learning#Information Fidelity#Data Composition#Diffusion Models#Multi-View Video Synthesis2025년 10월 10일댓글 수 로딩 중