[논문리뷰] CopT: Contrastive On-Policy Thinking with Continuous Spaces for General and Agentic Reasoning본 논문은 표준 CoT 패러다임이 가진 비효율적인 '생각 후 답변' 순서와, 이미 답변을 도출한 후에도 불필요하게 추론을 지속하는 Performative Reasoning 문제를 해결하고자 한다 .#Review#Large Language Models#Chain-of-Thought#Continuous Embeddings#Contrastive Verification#On-Policy Thinking#Agentic Reasoning2026년 5월 19일댓글 수 로딩 중