본문으로 건너뛰기

[논문리뷰] LawThinker: A Deep Research Legal Agent in Dynamic Environments

링크: 논문 PDF로 바로 열기

저자: Xinyu Yang, Chenlong Deng, Tongyu Wen, Binyu Xie, Zhicheng Dou*

핵심 연구 목표

법률 추론 태스크에서 정확한 최종 결과뿐만 아니라, 절차적으로도 적합한 추론 과정 을 보장하는 것을 목표로 합니다. 기존 대규모 언어 모델(LLM) 기반 방법론에서 발생하는 중간 추론 단계의 오류 전파 (예: 부적절한 법조문 인용) 문제를 해결하고, 동적인 사법 환경에서 신뢰할 수 있는 법률 인공지능 에이전트를 구축하고자 합니다.

핵심 방법론

자율적인 법률 연구 에이전트인 LawThinkerExplore-Verify-Memorize (EVM) 전략 을 채택합니다. 핵심적으로, 지식 탐색 단계마다 DeepVerifier 모듈 을 통해 검색된 정보의 지식 정확성, 사실-법률 관련성, 절차 준수 여부 를 명시적으로 검증합니다. 또한, 장기적인 태스크를 위해 메모리 모듈 을 활용하여 검증된 법률 지식과 사건 맥락을 지속적으로 저장하고 재사용하며, 이 세 가지 차원의 기능을 지원하는 15가지 법률 도구 를 설계했습니다.

주요 결과

J1-EVAL 동적 벤치마크 에서 LawThinker는 직접 추론 방식 대비 24% , 워크플로우 기반 방식 대비 11% 의 전반적인 성능 향상을 달성했습니다. 특히, 과정 지향적 지표(process-oriented metrics) 인 형식 준수(FOR) 및 절차 준수(PFS) 점수에서显著한 개선을 보였으며, 정적 벤치마크에서도 평균 6% 의 정확도 향상을 확인하여 방법론의 일반화 능력을 입증했습니다.

AI 실무자를 위한 시사점

법률 분야와 같이 높은 정확성 및 절차 준수 가 요구되는 도메인에서 LLM 적용 시 명시적인 중간 단계 검증 메커니즘 의 중요성을 강조합니다. DeepVerifier 와 같은 검증 모듈을 도입하면 LLM의 환각(hallucination) 을 효과적으로 줄이고 추론 신뢰도를 높일 수 있습니다. 또한, 메모리 모듈 을 통한 검증된 지식의 재사용은 장기적인 대화형 또는 다단계 태스크 에서 에이전트의 효율성과 일관성을 크게 향상시킬 수 있습니다.

⚠️ 알림: 이 리뷰는 AI로 작성되었습니다.

Review 의 다른글