[논문리뷰] Discovering Cooperative Pipelines: Autoresearch for Sequential Social Dilemmas기존의 LLM 기반 정책 합성 연구는 수동으로 설계된 파이프라인에 의존하며, 파이프라인의 각 구성 요소(프롬프트, 피드백 등)가 최종 정책의 질에 미치는 영향이 매우 큼에도 불구하고 이를 체계적으로 최적화하기 어렵다는 한계가 있습니다.#Review#Sequential Social Dilemmas#Autoresearch#LLM Policy Synthesis#Mechanism Design#Information Design#Multi-agent Reinforcement Learning2026년 5월 28일댓글 수 로딩 중