#MaxFlip

1개의 포스트

[논문리뷰] Who Flips? Self- and Cross-Model Counterarguments Reveal Answer Instability in LLMs

본 논문은 LLM이 정답을 알고 있음에도 불구하고, 외부의 그럴듯한 반론에 의해 얼마나 쉽게 답변을 번복하는지, 즉 '답변 안정성(Answer Stability)'을 체계적으로 평가하는 데 목적이 있습니다.

#Review #LLM #Answer Instability #Sycophancy #Argument-driven Challenge #MMLU #MaxFlip #Answer Flip Rate

2026년 6월 15일