[논문리뷰] Are LLM Decisions Faithful to Verbal Confidence?arXiv에 게시된 'Are LLM Decisions Faithful to Verbal Confidence?' 논문에 대한 자세한 리뷰입니다.#Review#Large Language Model#Uncertainty Quantification#Verbal Confidence#Abstention#Decision-Making#Risk-Sensitive AI#Utility Maximization2026년 1월 12일댓글 수 로딩 중
[논문리뷰] TruthRL: Incentivizing Truthful LLMs via Reinforcement LearningarXiv에 게시된 'TruthRL: Incentivizing Truthful LLMs via Reinforcement Learning' 논문에 대한 자세한 리뷰입니다.#Review#LLM Hallucination#Truthfulness#Reinforcement Learning#Ternary Reward#Abstention#Knowledge Boundary#GRPO#RLHF2025년 10월 1일댓글 수 로딩 중