[논문리뷰] RealICU: Do LLM Agents Understand Long-Context ICU Data? A Benchmark Beyond Behavior Imitation본 논문은 기존의 ICU 벤치마크들이 임상 의사결정을 단순한 정적 문제로 치부하거나, 과거 임상 기록을 그대로 정답으로 간주하는 'Behavior Imitation' 오류에 빠져 있다는 점을 지적한다.#Review#LLM Agents#ICU#Clinical Decision Support#Hindsight-Annotated Benchmark#Structured Memory#Sequential Decision-Making2026년 5월 13일댓글 수 로딩 중
[논문리뷰] InternAgent-1.5: A Unified Agentic Framework for Long-Horizon Autonomous Scientific Discovery본 논문은 기존 AI 과학자 시스템의 한계(도메인 특화 설계, 불완전한 추론 능력, 비효율적인 최적화 파이프라인, 장기 자율 운영 미흡)를 극복하고, 계산 및 경험적 영역 전반에 걸쳐 엔드투엔드 과학적 발견을 위한 통합 에이전트 프레임워크 인 InternAgent-1.5를 개발하는 것을 목표로 합니다.#Review#Agentic AI#Scientific Discovery#Long-Horizon Reasoning#Structured Memory#Knowledge Graph#Experimental Optimization#Multi-disciplinary2026년 2월 9일댓글 수 로딩 중