[논문리뷰] K-BrowseComp: A Web Browsing Agent Benchmark Grounded in Korean Contexts본 논문은 최신 Frontier 모델들이 Agentic Capability 평가로 패러다임을 전환하고 있음에도 불구하고, 한국어 환경에 특화된 브라우징 에이전트 벤치마크가 부재하다는 문제 의식에서 출발합니다.#Review#Web Browsing Agent#Korean Contexts#Agentic Benchmark#Information Retrieval#Multi-hop Reasoning#Synthetic Data Generation2026년 6월 1일댓글 수 로딩 중
[논문리뷰] Joint Agent Memory and Exploration Learning via Novelty Signals본 논문은 LLM 기반 에이전트가 개방형 환경에서 효율적인 탐색을 수행하지 못하는 문제를 해결하고자 합니다. 기존 에이전트는 환경과의 상호작용 기록이 길어짐에 따라 전체 기록을 유지하는 데 발생하는 막대한 계산 비용과 메모리 저장 공간 문제에 직면해 있습니다.#Review#Agent Memory#Exploration#Novelty Signals#GUI Agents#Latency#Token Efficiency#Latent Memory2026년 6월 1일댓글 수 로딩 중
[논문리뷰] Harness-1: Reinforcement Learning for Search Agents with State-Externalizing Harnesses본 연구는 기존 검색 에이전트들이 semantic 검색 결정과 복잡한 상태 관리(bookkeeping)를 동시에 수행함에 따라 발생하는 학습의 비효율성과 성능 저하 문제를 해결하고자 합니다.#Review#Retrieval-Augmented Generation#Reinforcement Learning#Stateful Harness#Cognitive Offloading#Search Agents2026년 6월 1일댓글 수 로딩 중
[논문리뷰] HakushoBench: A Japanese Chart and Table VQA Benchmark from Governmental White Papers본 연구는 기존 VQA 벤치마크들이 주로 서구권의 데이터나 단순한 합성 차트에 편향되어 있어, 일본의 공식 행정 문서와 같이 복잡한 레이아웃과 높은 Domain-Specific 지식을 요구하는 자료에 대한 평가가 부족하다는 점을 해결하고자 합니다.#Review#VQA#Japanese#Document AI#Multimodal LLMs#Chart Understanding#Table Reasoning#Benchmark2026년 6월 1일댓글 수 로딩 중
[논문리뷰] FineVerify: Scaling Test-Time Compute with Fine-Grained Self-Verification for Agentic Search본 논문은 기존의 Agentic Search 모델들이 겪는 정답의 희소성 문제와 기존 Test-Time Compute scaling 기법들이 가진 신뢰성 한계를 해결하고자 합니다.#Review#Agentic Search#Test-Time Compute#Self-Verification#Fine-Grained#LLM#Benchmark Auditing2026년 6월 1일댓글 수 로딩 중
[논문리뷰] EVA01: Unified Native 3D Understanding and Generation via Mixture-of-Transformers본 논문은 기존의 Diffusion 기반 3D 생성 모델들이 의미론적 이해(semantic understanding)와 기하학적 추론(geometric reasoning)을 분리하여 처리함으로써 발생하는 한계를 해결하고자 합니다.#Review#Multimodal Large Language Models#Mixture-of-Transformers#3D Native Generation#Context-aware Editing#Flow Matching#Sparse Voxel Representation2026년 6월 1일댓글 수 로딩 중
[논문리뷰] ESPO: Early-Stopping Proximal Policy Optimization본 논문은 LLM의 다단계 추론(Multi-step reasoning) 과정에서 발생하는 연산 비효율성과 잘못된 학습 신호 문제를 해결하기 위해 ESPO를 제안한다.#Review#Reinforcement Learning#Large Language Models#Proximal Policy Optimization#Early Stopping#Reasoning#Compute Efficiency#Credit Assignment2026년 6월 1일댓글 수 로딩 중
[논문리뷰] Draft-OPD: On-Policy Distillation for Speculative Draft Models죄송합니다. 제공해주신 URL(https://arxiv.org/html/2605.29343)에 대한 접근이 현재 기술적 제한으로 인해 불가능합니다. 요청하신 논문의 내용을 직접 확인할 수 없어, 해당 논문에 대한 전문적인 요약 및 분석을 수행할 수 없습니다.#Review2026년 6월 1일댓글 수 로딩 중
[논문리뷰] Domino: Decoupling Causal Modeling from Autoregressive Drafting in Speculative Decoding본 논문은 Speculative decoding에서 draft 품질과 연산 비용 간의 trade-off 문제를 해결하는 것을 목표로 합니다.#Review#Speculative Decoding#LLM Inference#Autoregressive Drafting#Parallel Drafting#Causal Modeling#Low-Rank Correction2026년 6월 1일댓글 수 로딩 중
[논문리뷰] Crafter: A Multi-Agent Harness for Editable Scientific Figure Generation from Diverse Inputs본 논문은 과학적 도해(Scientific Figure) 생성의 자동화가 현실적인 연구 환경의 다양성을 충족하지 못하며, 생성된 출력물이 편집 불가능하다는 한계를 해결하고자 합니다.#Review#Scientific Figure Generation#Multi-Agent Harness#Editable SVGs#Raster-to-Vector Conversion#CraftBench#LLM Agent#Iterative Refinement2026년 6월 1일댓글 수 로딩 중
[논문리뷰] Confidence-Adaptive SwiGLU for Mixture-of-Experts본 논문은 MoE 모델 내 SwiGLU 활성화 함수의 게이트 선택성이 훈련 과정 전반에 걸쳐 고정되어 있다는 점을 해결하고자 합니다.#Review#Mixture-of-Experts#SwiGLU#Gate Sharpness#Routing Confidence#Transformer#Activation Function#MoE2026년 6월 1일댓글 수 로딩 중
[논문리뷰] Can Predicted Dynamics Exist in the Physical World?본 논문은 시뮬레이션 환경에서 학습된 Predicted Dynamics가 실제 Physical World로 전이될 때 발생하는 성능 저하 및 불일치 문제를 해결하고자 한다.#Review#Physical Dynamics#Predictive Modeling#System Identification#Generalization#Real-world Deployment2026년 6월 1일댓글 수 로딩 중
[논문리뷰] Brain-IT-VQA: From Brain Signals to Answers본 논문은 기존의 fMRI 기반 시각적 재구성 및 VQA 연구들이 가진 성능적 한계와 신경과학적 해석의 어려움을 해결하고자 합니다.#Review#fMRI#Visual Question Answering#Brain Decoding#Vision-Language Models#Brain-IT#NSD-VQA2026년 6월 1일댓글 수 로딩 중
[논문리뷰] Agent Skills Should Go Beyond Text: The Case for Visual Skills본 논문은 현재 에이전트 스킬 학습 패러다임이 텍스트 중심적(text-only)으로 구성되어 있어 시각적 과업 수행 시 발생하는 '텍스트 병목 현상(Textual Bottleneck)'을 해결하고자 합니다 .#Review#Multimodal Agent#Visual Skill#Spatial Prior#GUI Grounding#Task Decomposition#Skill Reusability#Textual Degradation2026년 6월 1일댓글 수 로딩 중
[논문리뷰] Adapting Multilingual Embedding Models to Turkish via Cross-Lingual Tokenizer Surgery and Offline Distillation본 연구는 기존의 Multilingual Embedding Models가 Turkish와 같은 저자원(Low-resource) 언어에서 충분한 성능을 발휘하지 못하는 구조적 한계를 해결하고자 한다.#Review#Multilingual Embedding Models#Turkish#Tokenizer Surgery#Offline Distillation#Cross-Lingual Transfer#Semantic Search2026년 6월 1일댓글 수 로딩 중
[논문리뷰] ACL-Verbatim: hallucination-free question answering for research본 논문은 현대적인 Retrieval-Augmented Generation (RAG) 시스템이 근본적으로 지니고 있는 환각(Hallucination) 및 답변의 불투명성 문제를 해결하고자 합니다. 기존 LLM 기반 RAG는 문서를 참조하더라도 모델 내부 지식과 혼합되어 부정확하거나 무의미한 답변을 생성할 위험이 큽니다.#Review#Retrieval-Augmented Generation#Hallucination-free#Extractive Question Answering#ModernBERT#ACL Anthology#Scientific QA2026년 6월 1일댓글 수 로딩 중
[논문리뷰] A Matter of TASTE: Improving Coverage and Difficulty of Agent Benchmarks본 논문은 기존의 툴 사용 에이전트 벤치마크가 고정된 시나리오에 의존함에 따라 발생하는 심각한 포화(Saturation) 현상과 벤치마크 구축의 높은 노동 집약적 비용 문제를 해결하고자 합니다.#Review#Agent Benchmarks#Tool-use#Task Synthesis#Coverage#Difficulty#Adaptive Contrastive n-gram Model2026년 6월 1일댓글 수 로딩 중
[논문리뷰] 3DCodeBench: Benchmarking Agentic Procedural 3D Modeling Via Code본 논문은 현대 3D 생성 분야에서 Procedural Code 생성을 통한 모델링의 중요성이 커지고 있으나, 이를 객관적으로 평가할 수 있는 표준화된 벤치마크가 부재하다는 문제점을 해결하고자 합니다 .#Review#3D Modeling#Procedural Generation#Vision-Language Models#Agentic Workflow#Benchmark#Human-Preference#Blender2026년 6월 1일댓글 수 로딩 중
[논문리뷰] iVGR: Internalizing Visually Grounded Reasoning for MLLMs with Reinforcement Learning본 논문은 MLLM의 fine-grained perception을 향상하기 위해 도입된 Visually Grounded CoT가 오히려 추론 단계에서 성능 저하를 일으킬 수 있다는 문제점을 지적합니다.#Review#Multimodal Large Language Models#Reinforcement Learning#Visually Grounded Reasoning#Chain-of-Thought#Dual-Stream Training#Test-Time Scaling2026년 5월 31일댓글 수 로딩 중
[논문리뷰] dMoE: dLLMs with Learnable Block Experts본 논문은 MoE 기반 dLLM에서 블록 병렬 디코딩(block parallel decoding) 시 발생하는 과도한 전문가 활성화 문제를 해결하여 inference 효율성을 높이는 것을 목적으로 합니다.#Review#dLLM#Mixture-of-Experts#Parallel Decoding#Block-level Routing#Expert Compression#Memory-bound2026년 5월 31일댓글 수 로딩 중