[논문리뷰] When Confidence Misleads: Suffix Anchoring and Anchor-Proximity Confidence Modulation for Diffusion Language Models
링크: 논문 PDF로 바로 열기
저자: Jungwon Park, Jimyeong Kim, Jungmin Ko, Nojun Kwak, Wonjong Rhee
1. Key Terms & Definitions (핵심 용어 및 정의)
- DLM (Diffusion Language Model): 노이즈가 섞인 토큰 시퀀스를 반복적으로 Denoising하여 텍스트를 생성하는 모델로, 전체 토큰을 병렬적으로 생성하는 Fully Non-AR decoding을 지원합니다.
- Suffix Anchoring: 모델이 응답을 조기에 종료(Early termination)하지 않도록 유도하기 위해 응답 영역 끝에 "The answer is"와 같은 짧은 구문을 미리 삽입하는 추론 전략입니다.
- Confidence-Based Decoding: 각 마스크된 위치의 예측 확신도(Confidence score)를 기반으로 어떤 토큰을 먼저 해독(Unmasking)할지 결정하는 방식입니다.
- Anchor-Proximity Confidence Modulation: Suffix anchor 주변의 확신도가 일시적으로 과도하게 높아지는 문제를 방지하기 위해, 디코딩 진행 상황에 따라 앵커 근처의 확신도 점수를 동적으로 가중치 조절하는 기법입니다.
2. Motivation & Problem Statement (연구 배경 및 문제 정의)
본 논문은 Fully Non-AR DLM decoding 과정에서 나타나는 고질적인 생성 실패 문제를 해결하고자 한다. 기존의 확신도 기반 디코딩은 EOT(End-of-Text) 토큰에 과도하게 높은 확신도를 부여하여 응답이 불완전하게 생성되는 문제를 안고 있다 [Figure 1]. 저자들은 Suffix anchoring을 통해 EOT overconfidence를 완화할 수 있음을 발견했으나, 이 방식이 앵커 인접 토큰들에 대해 국소적인 과신뢰(Local overconfidence)를 유도하여 해당 위치의 토큰이 부적절하게 조기 해독되는 새로운 부작용을 야기한다는 점을 지적한다 [Figure 1]. 결과적으로 기존 모델들은 충분한 맥락이 형성되기 전에 조기 해독된 토큰들로 인해 정확도가 저하되는 한계에 직면해 있다.

Figure 1 — 디코딩 실패 모드와 분석
3. Method & Key Results (제안 방법론 및 핵심 결과)
본 논문은 Suffix anchoring의 이점은 유지하면서 조기 해독의 부작용을 억제하는 Suffix-Anchored Confidence Modulation을 제안한다 [Figure 3]. 이 방법론은 크게 두 가지 단계로 구성되는데, 우선 응답 영역에 짧은 접미사를 삽입하여 응답 완료를 유도하고, 디코딩 진행도(Progress)에 따라 앵커 근처의 확신도를 수학적으로 낮추는 가중치 조절(Weighting)을 수행한다 [Figure 3]. 이러한 방식은 추가적인 모델 학습(Training-free)이나 아키텍처 변경 없이 기존 디코딩 전략에 즉각적으로 적용 가능하다는 장점이 있다.

Figure 3 — 제안 방법론 개요
주요 실험 결과, 제안 방법론은 LLaDA 및 Dream 모델을 사용한 GSM8K 벤치마크에서 기존의 확신도 기반 디코딩 대비 월등한 성능 향상을 입증하였다. 특히 LLaDA 모델의 경우, Top-probability 디코딩 환경에서 GSM8K 정확도를 기존 14.94%에서 76.88%로 비약적으로 향상시켰다 [Table 1]. 또한 Vision-language reasoning 벤치마크에서도 LaViDa 모델 기준 기존 방식보다 훨씬 높은 정확도를 보였으며, 이는 EOT suppression과 같은 강제적인 제약 조건 없이도 더 우수한 결과를 도출함을 시사한다 [Table 2, Table 3].
4. Conclusion & Impact (결론 및 시사점)
본 논문은 Suffix-Anchored Confidence Modulation을 통해 Fully Non-AR 디코딩의 병렬 생성 장점을 보존하면서도 추론 정확도를 획기적으로 개선하였다. 제안된 방법론은 학습 없이도 모델의 확신도 기반 디코딩 성능을 안정화할 수 있음을 보여주며, 다양한 reasoning 및 code-generation 과제에서 강력한 성능을 증명하였다. 이 연구는 확신도 기반 추론의 불투명성을 해결하고 DLM의 실용적 활용 가능성을 확장했다는 점에서 해당 분야의 학계 및 산업계에 유의미한 기여를 한다.

Figure 2 — Suffix anchoring의 영향
⚠️ 알림: 이 리뷰는 AI로 작성되었습니다.
관련 포스트
Review 의 다른글
- 이전글 [논문리뷰] VisualThink-VLA: Visual Intermediate Reasoning for Effective and Low-Latency Vision-Language-Action Policies
- 현재글 : [논문리뷰] When Confidence Misleads: Suffix Anchoring and Anchor-Proximity Confidence Modulation for Diffusion Language Models
- 다음글 [논문리뷰] dMoE: dLLMs with Learnable Block Experts
댓글