#Strategic Decision Making

1개의 포스트

[논문리뷰] GTAlign: Game-Theoretic Alignment of LLM Assistants for Mutual Welfare

본 논문은 LLM이 사용자에게 최적화되지 않은 응답을 생성하여 개별적인 합리적 선택이 사회적으로 최적화되지 않은 결과를 초래하는 프리저너스 딜레마(prisoner's dilemma) 와 유사한 문제를 해결하고자 합니다.

#Review #Large Language Models #LLM Alignment #Game Theory #Reinforcement Learning #Mutual Welfare #Payoff Matrix #Strategic Decision Making #Human-AI Interaction

2025년 10월 13일