#Reasoning Errors

1개의 포스트

[논문리뷰] Hop, Skip, and Overthink: Diagnosing Why Reasoning Models Fumble during Multi-Hop Analysis

현재 대규모 언어 모델(LLM)이 다단계(multi-hop) 질문 답변 태스크에서 환각(hallucination)을 보이거나 추론에 실패하는 근본적인 원인을 진단하는 것이 주된 목표입니다.

#Review #Multi-hop Question Answering #Large Language Models #Reasoning Errors #Error Taxonomy #Human Evaluation #Automated Evaluation #Overthinking

2025년 8월 8일