[논문리뷰] Who Flips? Self- and Cross-Model Counterarguments Reveal Answer Instability in LLMs본 논문은 LLM이 정답을 알고 있음에도 불구하고, 외부의 그럴듯한 반론에 의해 얼마나 쉽게 답변을 번복하는지, 즉 '답변 안정성(Answer Stability)'을 체계적으로 평가하는 데 목적이 있습니다.#Review#LLM#Answer Instability#Sycophancy#Argument-driven Challenge#MMLU#MaxFlip#Answer Flip Rate2026년 6월 15일댓글 수 로딩 중