#Self-Consistency

6개의 포스트

[논문리뷰] Model Capability Dominates: Inference-Time Optimization Lessons from AIMO 3

본 논문은 LLM의 수학적 추론 능력을 향상시키기 위한 Inference-Time Optimization 기법들이 실질적인 효과가 있는지 검증하고자 합니다.

#Review #LLM #Mathematical Reasoning #Inference-Time Optimization #Majority Voting #Self-Consistency #Diverse Prompting

2026년 4월 16일

[논문리뷰] Scientific Graphics Program Synthesis via Dual Self-Consistency Reinforcement Learning

본 논문은 정적인 과학 그래픽을 편집 가능한 TikZ 코드로 역공학(Reverse-engineering)하는 과정에서 발생하는 엄격한 공간적 제약 문제를 해결하고자 합니다.

#Review #Graphics Program Synthesis #TikZ #Reinforcement Learning #Multimodal Large Language Models #Self-Consistency #Round-Trip Verification

2026년 4월 7일

[논문리뷰] Understanding Syllogistic Reasoning in LLMs from Formal and Natural Language Perspectives

본 연구는 LLM의 연역적 추론 능력 을 논리적(형식적) 및 직관적(자연어) 관점에서 깊이 이해하는 것을 목표로 합니다.

#Review #Syllogistic Reasoning #Large Language Models (LLMs)#Belief Bias #Natural Language Understanding (NLU)#Formal Logic #Prompt Engineering #Self-Consistency #Cognitive Psychology

2025년 12월 22일

[논문리뷰] Thinking with Video: Video Generation as a Promising Multimodal Reasoning Paradigm

기존의 'Thinking with Text' 및 'Thinking with Images' 패러다임이 가진 정적 이미지의 한계와 모달리티 분리 문제를 극복하고자 합니다.

#Review #Video Generation #Multimodal Reasoning #Temporal Understanding #Spatial Reasoning #Foundation Models #AI Benchmarking #In-Context Learning #Self-Consistency

2025년 11월 9일

[논문리뷰] Deep Think with Confidence

본 논문은 LLM의 추론 태스크에서 self-consistency (다수결 투표) 방식의 한계점인 정확도 저하 및 높은 연산 오버헤드를 해결하는 것을 목표로 합니다. 특히, 추론 과정의 효율성과 성능을 동시에 향상시키기 위해 저품질 추론 경로를 동적으로 필터링 하는 방법을 제시합니다.

#Review #LLM Reasoning #Confidence Filtering #Self-Consistency #Test-Time Optimization #Computational Efficiency #Adaptive Sampling #Early Stopping #Majority Voting

2025년 8월 22일

[논문리뷰] Annotation-Efficient Universal Honesty Alignment

본 논문은 대규모 언어 모델(LLM)이 지식 경계를 인식하고 보정된 자신감을 표현하는 Honesty Alignment 를 달성하는 것을 목표로 합니다.

#Review #LLM Honesty Alignment #Confidence Calibration #Annotation Efficiency #Self-Consistency #Elicitation-Then-Calibration (EliCal)#HonestyBench #LoRA #Trustworthy AI

2025년 10월 21일