[논문리뷰] SoCRATES: Towards Reliable Automated Evaluation of Proactive LLM Mediation across Domains and Socio-cognitive Variations본 논문은 실시간으로 변화하는 복잡한 갈등 상황에서 LLM 기반 중재자를 안정적으로 평가할 수 있는 체계적인 방법론이 부재하다는 문제에서 출발한다. 기존 연구들은 몇몇 제한된 도메인에 의존하거나, 중재자의 성능을 전체 대화 맥락에서 평가함으로써 관련 없는 대화 내용에 의한 노이즈를 발생시킨다는 한계가 있다.#Review#LLM Mediation#Automated Evaluation#Socio-cognitive Adaptation#Agentic Pipeline#Topic-localized Evaluation2026년 6월 7일댓글 수 로딩 중
[논문리뷰] Function2Scene: 3D Indoor Scene Layout from Functional Specifications기존의 텍스트 기반 3D 실내 레이아웃 생성 모델들은 주로 가구 목록을 배치하는 '객체 중심(object-centric)' 접근 방식을 취하고 있어, 실제 실내 디자인의 핵심인 인간의 활동과 기능을 충분히 지원하지 못한다는 한계가 있습니다 .#Review#3D Indoor Scene Synthesis#Functional Specification#Constraint Taxonomy#Iterative Refinement#Agentic Pipeline#Human-Centered Design2026년 5월 31일댓글 수 로딩 중
[논문리뷰] ResearchMath-14K: Scaling Research-Level Mathematics via Agents본 논문은 최신 LLM이 기초적인 수학 경시 수준을 넘어 연구 수준(research-level)의 수학 문제를 해결하도록 유도하는 데 필요한 대규모 학습 데이터가 부족하다는 점을 해결하고자 한다.#Review#Research-level Mathematics#Dataset Construction#Agentic Pipeline#Factuality#Reasoning Trajectories#Fine-tuning#Language Models2026년 5월 27일댓글 수 로딩 중
[논문리뷰] Evaluating Temporal Semantic Caching and Workflow Optimization in Agentic Plan-Execute Pipelines본 논문은 산업 자산 운영(Asset Operations) 분야의 에이전트 파이프라인이 겪는 높은 대기 시간과 기존 캐싱 기법의 한계 문제를 해결합니다.#Review#Agentic Pipeline#Model Context Protocol#Temporal Semantic Caching#Workflow Optimization#Industrial Asset Operations#Latency Reduction2026년 5월 20일댓글 수 로딩 중
[논문리뷰] Unify-Agent: A Unified Multimodal Agent for World-Grounded Image Synthesis기존의 Text-to-Image(T2I) 모델들은 고품질 이미지 생성 능력은 탁월하지만, 학습 데이터에 포함되지 않은 long-tail 개념이나 특정 인물, 문화적 상징 등 외부 세계 지식이 요구되는 상황에서 identity drift나 환각(hallucination) 문제를 겪습니다.#Review#Multimodal Agent#World-Grounded Image Synthesis#FactIP#Agentic Pipeline#Unified Multimodal Model#Evidence-Grounded Recaptioning2026년 3월 31일댓글 수 로딩 중
[논문리뷰] VQ-VA World: Towards High-Quality Visual Question-Visual Answering본 논문은 시각적 질문에 대한 시각적 답변(VQ-VA) 능력, 즉 이미지를 통해 질문에 응답하는 기능을 오픈 소스 모델에도 도입하는 것을 목표로 합니다.#Review#Visual Question Answering (VQA)#Image Generation#Data-centric AI#Agentic Pipeline#Multimodal Models#Web-scale Data#Benchmark#LightFusion2025년 11월 25일댓글 수 로딩 중