[논문리뷰] A Self-Evolving Framework for Efficient Terminal Agents via Observational Context CompressionarXiv에 게시된 'A Self-Evolving Framework for Efficient Terminal Agents via Observational Context Compression' 논문에 대한 자세한 리뷰입니다.#Review#Terminal Agents#Context Compression#Self-evolving Framework#Token Efficiency#Long-horizon Reasoning#Training-free2026년 4월 22일댓글 수 로딩 중
[논문리뷰] PRL-Bench: A Comprehensive Benchmark Evaluating LLMs' Capabilities in Frontier Physics ResearchYuelin Hu이 arXiv에 게시한 'PRL-Bench: A Comprehensive Benchmark Evaluating LLMs' Capabilities in Frontier Physics Research' 논문에 대한 자세한 리뷰입니다.#Review#PRL-Bench#LLMs#Scientific Benchmarks#Physics Research#End-to-End Workflow#Long-horizon Reasoning#Agentic Science2026년 4월 19일댓글 수 로딩 중
[논문리뷰] UniVA: Universal Video Agent towards Open-Source Next-Generation Video GeneralistarXiv에 게시된 'UniVA: Universal Video Agent towards Open-Source Next-Generation Video Generalist' 논문에 대한 자세한 리뷰입니다.#Review#Video Agents#Multi-modal AI#Plan-Act Architecture#Tool-Use#Long-horizon Reasoning#Open-source#Video Generation#Video Understanding2025년 11월 13일댓글 수 로딩 중