[논문리뷰] Critic-R: Improving Agentic Search using Instruction-tuned Retrievers with Natural Language Introspective Feedback본 논문은 Agentic Search 환경에서 기존 Retriever의 경직성이 전체 시스템 성능의 병목 현상(bottleneck)을 유발한다는 점을 해결하고자 합니다 . 기존 연구들은 주로 Reasoning Agent만을 최적화하거나, Retriever를 고정된 블랙박스로 간주하는 한계를 보입니다.#Review#Agentic Search#Retrieval-Augmented Generation#Instruction-tuned Retriever#Inference-time Scaling#Contrastive Learning#Introspective Feedback2026년 6월 7일댓글 수 로딩 중
[논문리뷰] Compress-Distill: Reasoning Trace Compression for Efficient Knowledge Distillation본 논문은 최신 Reasoning 모델들이 생성하는 긴 Chain-of-Thought 추론 과정이 Distillation 시 비용을 크게 증가시키고, Student 모델이 지나치게 장황한 답변을 생성하도록 유도한다는 점에 주목합니다.#Review#Knowledge Distillation#Chain-of-Thought#Reasoning Trace#Model Compression#Supervised Fine-tuning#Inference Efficiency#Large Language Models2026년 6월 7일댓글 수 로딩 중
[논문리뷰] Augmenting Attention with Exponentially Decaying Memory Improves Query-Aware KV Sparsity본 논문은 Long-context LLM의 추론 효율성을 높이기 위한 기존 Query-aware sparse inference 기법들의 성능 한계를 극복하는 것을 목표로 한다.#Review#Efficient Inference#Query-Aware Sparsity#KV-cache#Exponentially Decaying Memory#RAT+#Long-Context LLM2026년 6월 7일댓글 수 로딩 중
[논문리뷰] AnchorWorld: Embodied Egocentric World Simulation with View-based Evolution Customization기존의 interactive world model들은 주로 키보드/마우스 입력이나 단순한 텍스트 프롬프트에 의존하여, 인간의 실제 동작(full-body motion)에 기반한 자연스러운 상호작용을 반영하지 못하는 한계가 있습니다.#Review#Embodied AI#Egocentric World Simulation#World Customization#Human Action Control#Anchor-View Priors#Video Generation2026년 6월 7일댓글 수 로딩 중
[논문리뷰] World-Language-Action Model for Unified World Modeling, Language Reasoning, and Action Synthesis본 논문은 기존의 WAM (World-Action Model)과 VLA (Vision-Language-Action Model)가 가진 한계를 극복하기 위해 제안되었다.#Review#Embodied AI#World Modeling#Language Reasoning#Action Synthesis#Autoregressive Transformer#Test-Time Scaling#Cross-Embodiment2026년 6월 4일댓글 수 로딩 중
[논문리뷰] VideoKR: Towards Knowledge- and Reasoning-Intensive Video Understanding본 논문은 현대의 멀티모달 모델들이 단순한 시각적 인식을 넘어 전문적인 도메인 지식과 다단계 추론이 필요한 비디오 이해 태스크에서 한계를 보인다는 점을 지적한다.#Review#Video Understanding#Knowledge-Intensive Reasoning#Training Corpus#CoT#Benchmark#Skill-Oriented#Reinforcement Learning2026년 6월 4일댓글 수 로딩 중
[논문리뷰] Video2LoRA: Parametric Video Internalization for Vision-Language Models본 논문은 기존 VLM 기반 비디오 이해 모델들이 겪는 고질적인 컨텍스트 윈도우 병목 현상과 과도한 토큰 소비 문제를 해결하고자 합니다. 기존 방식은 프레임별로 수백 개의 시각 토큰을 컨텍스트에 삽입해야 하므로, 영상 길이가 길어지거나 질의가 반복될 때마다 메모리와 Latency 부담이 기하급수적으로 증가합니다 .#Review#Video-Language Models#Low-Rank Adaptation#Hypernetwork#Video Internalization#Inference Efficiency#Parametric Knowledge Compression#Perceiver2026년 6월 4일댓글 수 로딩 중
[논문리뷰] Unsupervised Skill Discovery for Agentic Data Analysis본 논문은 데이터 분석 에이전트의 성능 향상을 위한 효과적인 스킬을 지도 학습 없이 발견하는 문제를 다룬다. 데이터 분석 작업은 도메인과 데이터 형식이 다양하여 표준화된 파이프라인 적용이 어렵고, 성공 여부를 판단하기 위한 신뢰성 있는 지도 데이터(Annotation)를 획득하는 데 큰 비용이 발생한다.#Review#Agentic Data Analysis#Unsupervised Skill Discovery#Inference-time Augmentation#LLM Agent#Adaptive Checklist Verifier#Answer Agreement Verifier2026년 6월 4일댓글 수 로딩 중
[논문리뷰] Towards Truly Multilingual ASR: Generalizing Code-Switching ASR to Unseen Language Pairs본 연구는 코드 스위칭 ASR 시스템이 소수의 학습된 언어 쌍을 넘어 보지 못한 언어 쌍으로 범용성을 확장할 수 있는지 검증합니다.#Review#Automatic Speech Recognition (ASR)#Code-Switching (CS)#Model Merging#Domain Generalization#Multilingual ASR#Generalization2026년 6월 4일댓글 수 로딩 중
[논문리뷰] Towards One-to-Many Temporal Grounding본 연구는 기존 Temporal Grounding 연구들이 주로 단일 세그먼트 검색(One-to-One)에 치중되어 있어, 실세계의 반복적인 이벤트 구조를 다루지 못한다는 한계를 해결합니다.#Review#Temporal Grounding#MLLM#One-to-Many#Reinforcement Learning#Event Cardinality#Benchmark2026년 6월 4일댓글 수 로딩 중
[논문리뷰] The Shape of Addition: Geometric Structures of Arithmetic in Large Language Models본 논문은 LLM이 고차원적인 추론에서는 뛰어난 성능을 보임에도 불구하고, 다중 자리수 덧셈과 같은 기초적인 산술 연산에서 발생하는 체계적인 오류(Off-by-one error)를 해결하고자 합니다.#Review#Mechanistic Interpretability#Large Language Models#Arithmetic Reasoning#Probing#Representation Geometry#Inference-time Intervention2026년 6월 4일댓글 수 로딩 중
[논문리뷰] The Shadow Price of Reasoning: Economic Perspective on Optimal Budget Allocation for LLMs본 연구는 고정된 컴퓨팅 자원 환경에서 LLM의 추론 성능을 극대화하기 위한 효율적인 예산 배분 문제를 해결합니다. 기존의 Uniform 정책은 모든 쿼리에 동일한 토큰 제한을 부여함으로써, 쉬운 문제에는 자원을 낭비하고 어려운 문제에는 성능 발휘에 필요한 충분한 자원을 제공하지 못하는 한계가 있습니다.#Review#Inference-time Scaling#Budget Allocation#Shadow Price#Lambert W Function#Rational Abandonment#LLM Reasoning#Compute-Utility Equilibrium2026년 6월 4일댓글 수 로딩 중
[논문리뷰] TIDE: Proactive Multi-Problem Discovery via Template-Guided Iteration본 논문은 기존 LLM 에이전트가 사용자 요청에만 의존하는 수동적(Reactive) 모델이라는 점을 문제로 정의합니다. 실제 환경에서는 사용자가 미처 인지하지 못한 다수의 잠재적 문제가 존재함에도 불구하고, 기존 방식은 가장 눈에 띄는 문제 하나에만 집중하거나 일반적인 추론에 그치는 경향이 있습니다.#Review#Proactive Agents#Multi-Problem Discovery#Thought Templates#Iterative Discovery#LLM Agents#Context Understanding2026년 6월 4일댓글 수 로딩 중
[논문리뷰] SePO: Self-Evolving Prompt Agent for System Prompt Optimization본 논문은 기존 시스템 프롬프트 최적화 방식이 갖는 불완전한 최적화 루프 문제를 해결하고자 합니다.#Review#Prompt Optimization#Self-Evolving Agents#Evolutionary Search#System Prompt#Meta-Learning#Cross-Task Generalization2026년 6월 4일댓글 수 로딩 중
[논문리뷰] SEAOTTER: Sensor Embedded Autoencoding with One-Time Transcode for Efficient Reconstruction로봇 시스템은 저비용·저전력 센서로부터 방대한 시각 데이터를 수집하지만, 제한된 대역폭과 온디바이스(on-device) 컴퓨팅 자원으로 인해 고해상도 처리에 어려움을 겪고 있습니다.#Review#Cloud Robotics#Image Compression#Representation Learning#Asymmetric Autoencoder#JPEG#Transcoding2026년 6월 4일댓글 수 로딩 중
[논문리뷰] RobotValues: Evaluating Household Robots When Human Values Conflict본 논문은 기존의 로봇 벤치마크가 작업 완수(task completion)나 안전 준수 여부에만 집중하여, 인간의 다양한 가치가 충돌하는 일상적인 의사결정 상황을 간과하고 있다는 문제를 제기합니다 . 가정 내 로봇은 사적인 공간에 존재하며, 로봇의 선택은 사용자의 안전, 프라이버시, 자율성 등에 즉각적인 영향을 미칩니다.#Review#Household Robots#Value-Conflict#Vision-Language Models#Human-Robot Interaction#Benchmarking#Alignment2026년 6월 4일댓글 수 로딩 중
[논문리뷰] Revising Context, Shifting Simulated Stance: Auditing LLM-Based Stance Simulation in Online Discussions본 연구는 LLM이 온라인 사용자들의 의견을 시뮬레이션할 때, 이것이 실제 신념의 반영인지 아니면 문맥에 따른 모델의 표면적 반응인지를 체계적으로 파악하고자 합니다.#Review#LLM-based Stance Simulation#Counterfactual Context Revision#Online Discussion#Multimodal Stance#Context Sensitivity#Social Simulation2026년 6월 4일댓글 수 로딩 중
[논문리뷰] Rethinking Continual Experience Internalization for Self-Evolving LLM Agents본 논문은 LLM Agent의 Continual Learning을 위한 Experience Internalization 과정에서 나타나는 Capability Collapse 문제를 해결하고자 합니다.#Review#Experience Internalization#Self-Evolving LLM Agents#Continual Learning#Context Distillation#Tool Use#Step-wise Injection#Off-policy Distillation2026년 6월 4일댓글 수 로딩 중
[논문리뷰] Reinforcement Learning Elicits Contextual Learning of Unseen Language Translation본 논문은 초저자원(Extreme Low-resource) 언어 번역을 위해 모델이 특정 언어를 암기하는 방식에서 벗어나, 언어에 독립적인 Meta-skill을 습득하게 하는 새로운 학습 프레임워크를 제안합니다.#Review#Low-resource Translation#Reinforcement Learning#In-context Learning#Meta-skill#Language-independent Learning#Meta-linguistic Reasoning2026년 6월 4일댓글 수 로딩 중
[논문리뷰] Quality-Guided Semi-Supervised Learning for Medical Image Segmentation본 연구는 의료 영상 세그멘테이션의 데이터 부족 문제를 해결하기 위한 Semi-Supervised Learning (SSL)에서 Pseudolabel의 신뢰도를 평가하는 기존 방식의 한계를 극복하고자 합니다.#Review#Semi-Supervised Learning#Medical Image Segmentation#Quality Prediction#Pseudolabeling#Contextual Grounding#Consistency Regularization2026년 6월 4일댓글 수 로딩 중