Review

[논문리뷰] PRISM: A Multi-Dimensional Benchmark for Evaluating LLM Peer Reviewers

본 논문은 급증하는 머신러닝 논문 투고량으로 인해 피어 리뷰 시스템이 한계에 직면했으며, 이를 보완하기 위한 LLM 기반 자동화 리뷰어의 실질적인 역량을 검증해야 한다는 문제의식에서 출발합니다.

#Review #LLM Peer Reviewer #Benchmarking Framework #Scientific Peer Review #Argument Mining #Retrieval-Augmented Verification #Constructiveness

2026년 5월 28일

[논문리뷰] OmniRetrieval: Unified Retrieval across Heterogeneous Knowledge Sources

본 연구는 현실 세계의 다양한 정보 요구가 비정형 텍스트, 관계형 데이터베이스, 지식 그래프 등 구조적으로 이질적인 소스들에 분산되어 있음에도 불구하고, 기존 검색 시스템들이 단일 소스 혹은 단일 query language에만 최적화되어 있어 통합적인 검색이 어렵다는 점을 해결하고자 합니다 .

#Review #OmniRetrieval #Heterogeneous Knowledge Sources #Native Query Language #Unified Retrieval #LLM #Knowledge Graph #Text-to-SQL

2026년 5월 28일

[논문리뷰] OmniInteract: Benchmarking Real-World Streaming Interaction for Real-Time Omnimodal Assistants

본 논문은 오디오-비주얼 스트리밍 환경에서 Omnimodal Large Language Models가 실시간으로 상호작용하는 능력을 평가하는 데 있어 기존 벤치마크들의 한계를 해결하고자 합니다.

#Review #Omnimodal LLM #Streaming Interaction #Benchmark #Real-time AI #Full-duplex #Interaction-Aware Scoring

2026년 5월 28일

[논문리뷰] ORACLE: Anticipating Scams from Partial Trajectories in Streaming App Usage

본 논문은 현대의 스마트폰 사기가 단일 앱 내의 메시지 분석만으로는 탐지하기 어려운 다단계, 교차 앱(Cross-app) 형태의 복합적인 과정을 거친다는 문제점에서 출발합니다 .

#Review #Scam Anticipation #Streaming App Usage #Agentic Framework #Self-Evolving Context Manager #On-Policy Self-Distillation #Cross-temporal Reasoning #Long-horizon Benchmark

2026년 5월 28일

[논문리뷰] NeuROK: Generative 4D Neural Object Kinematics

본 논문은 정적 3D 형상으로부터 물리적으로 타당한 4D 동적 궤적을 생성하는 범용적인 프레임워크의 부재 문제를 해결합니다. 기존 연구들은 특정 객체 범주에 최적화된 물리 모델이나 명시적인 물리 파라미터 식별에 의존하여 확장성이 낮고 범용성이 떨어진다는 한계가 있습니다.

#Review #Neural Object Kinematics #4D Generative Simulation #Lagrangian Mechanics #Latent Manifold #Kinematic Parameterization

2026년 5월 28일

[논문리뷰] Native Audio-Visual Alignment for Generation

본 논문은 오디오-비디오 조인트 생성 모델에서 발생하는 동기화 성능 저하와 모달리티 간 정보 결합 문제를 해결하는 것을 목표로 합니다.

#Review #Audio-Visual Generation #Native Alignment #MMDiT #Timbre-in-Context Conditioning #Condition-Factorized Guidance

2026년 5월 28일

[논문리뷰] MoZoo:Unleashing Video Diffusion power in animal fur and muscle simulation

전통적인 CG (Computer Graphics) 파이프라인에서 동물의 fur와 muscle dynamics를 시뮬레이션하는 작업은 고도의 전문성과 막대한 컴퓨팅 자원을 요구하는 노동 집약적인 과정입니다.

#Review #Video Diffusion #Animal Fur Simulation #Muscle Dynamics #Generative Dynamics Solver #Role-Aware RoPE #Asymmetric Decoupled Attention

2026년 5월 28일

[논문리뷰] LoMo: Local Modality Substitution for Deeper Vision-Language Fusion

본 논문은 최신 VLM들이 텍스트 질문을 그에 대응하는 렌더링된 이미지로 교체했을 때 발생하는 성능 저하 문제, 즉 carrier sensitivity 문제를 해결하고자 합니다.

#Review #Vision-Language Models #Modality Gap #Carrier Sensitivity #Local Modality Substitution #Supervised Fine-Tuning #Cross-modal Alignment

2026년 5월 28일

[논문리뷰] LiteCoder-Terminal: Scaling Long-Horizon Terminal Environments for Learning Language Agents

본 논문은 기존의 터미널 에이전트 학습이 외부 리포지토리에 의존하는 방식의 한계로 인해 데이터 다양성, 환경 제어력, 특정 능력 결함 해결에 어려움을 겪는 문제를 해결합니다.

#Review #Language Agents #Terminal Environments #Zero-dependency Synthesis #Supervised Fine-tuning #Direct Multi-turn Preference Optimization #Long-horizon Tasks

2026년 5월 28일

[논문리뷰] Learning A Unified Risk Map for Autonomous Driving in Partially Observable Environments

본 논문은 자율주행 환경에서 시야가 차단된(partially observable) 환경에서의 인지 불확실성과 이로 인한 주행 전략 수립의 한계를 해결하고자 합니다.

#Review #Autonomous Driving #Partial Observability #Risk Map #Diffusion Model #Occlusion-Aware Prediction #Trajectory Planning

2026년 5월 28일

[논문리뷰] LaRA: Layer-wise Representation Analysis for Detecting Data Contamination in RL Post-Training

본 논문은 RL post-training 과정에서 발생하는 data contamination이 모델의 평가 신뢰성과 일반화 성능을 저해한다는 문제를 지적한다. 기존의 탐지 방식은 주로 token likelihood나 entropy 등 출력(Output-level) 신호에 의존해왔다.

#Review #Data Contamination #Reinforcement Learning #Membership Inference Attack #Representation Geometry #Representation Dynamics #Model Interpretability

2026년 5월 28일

[논문리뷰] Is Position Bias in Dense Retrievers Built In-or Learned from Data?

본 논문은 Dense Retrievers가 문서 내 정보 위치에 따라 성능이 크게 변하는 Position Bias 문제를 해결하고자 한다. 기존 연구들은 이러한 편향의 원인을 모델의 아키텍처나 사전 학습(pretraining) 방식에서 찾으려 했으나, 이들만으로는 체계적인 편향 방향을 완벽히 설명하지 못한다.

#Review #Dense Retrievers #Position Bias #Fine-tuning #Position-Controlled Data #Retrieval-Augmented Generation #Positional Sensitivity #Data Curation

2026년 5월 28일

[논문리뷰] How LoRA Remembers? A Parametric Memory Law for LLM Finetuning

본 논문은 LoRA를 활용한 Parametric Memory의 용량 한계와 내부 기억 메커니즘을 정량적으로 규명하는 것을 핵심 문제로 다룹니다 .

#Review #LoRA #Parametric Memory Law #Exact Memorization #Deterministic Phase Transition #MemFT

2026년 5월 28일

[논문리뷰] Geometry Matters: 3D Foundation Priors for Learning Semantic Correspondence

본 논문은 2D 기반 Foundation Model들이 가지는 3D 인지 능력 부족으로 인한 semantic correspondence의 구조적 오류를 해결하고자 합니다.

#Review #Semantic Correspondence #3D Foundation Models #PartField #Geodesic Filtering #Self-Supervised Learning #Render-and-Compare

2026년 5월 28일

[논문리뷰] GenClaw: Code-Driven Agentic Image Generation

본 논문은 기존의 end-to-end 방식의 image generation 모델이 겪는 제어 가능성 및 추론 능력의 한계를 해결하고자 합니다. 기존 모델들은 프롬프트 재작성을 통해 반복적인 '블랙박스' 식 시행착오를 거치며, 복잡한 공간 관계나 텍스트 레이아웃을 정밀하게 제어하는 데 실패하는 경우가 많습니다 .

#Review #Agentic Image Generation #Code-Driven #SVG #Multimodal Reasoning #Layered Representation #Controllable Generation

2026년 5월 28일

[논문리뷰] EarlyTom: Early Token Compression Completes Fast Video Understanding

본 논문은 Video-LLM의 추론 효율성을 저해하는 가장 큰 병목 현상이 LLM 자체가 아닌 Vision Encoder 단계에 집중되어 있다는 점을 지적한다. 기존의 토큰 압축 연구들은 주로 LLM 내부나 그 이후 단계의 처리에 집중하여 TTFT를 효과적으로 줄이지 못했다 .

#Review #Video-LLMs #Token Compression #Vision Encoder #Time-to-First-Token #Inference Efficiency #Training-free

2026년 5월 28일

[논문리뷰] Discovering Cooperative Pipelines: Autoresearch for Sequential Social Dilemmas

기존의 LLM 기반 정책 합성 연구는 수동으로 설계된 파이프라인에 의존하며, 파이프라인의 각 구성 요소(프롬프트, 피드백 등)가 최종 정책의 질에 미치는 영향이 매우 큼에도 불구하고 이를 체계적으로 최적화하기 어렵다는 한계가 있습니다.

#Review #Sequential Social Dilemmas #Autoresearch #LLM Policy Synthesis #Mechanism Design #Information Design #Multi-agent Reinforcement Learning

2026년 5월 28일

[논문리뷰] Colored Noise Diffusion Sampling

본 논문은 기존의 Diffusion model SDE(Stochastic Differential Equations) 솔버가 생성 과정의 Spectral Bias를 무시하고 균일한(uniform) white noise를 주입함으로써 유한한 에너지 예산을 비효율적으로 사용하는 문제를 해결합니다.

#Review #Diffusion Models #Spectral Bias #Stochastic Differential Equations #Colored Noise Sampling #Inference-time Optimization #Generative Fidelity

2026년 5월 28일

[논문리뷰] CollectionLoRA: Collecting 50 Effects in 1 LoRA via Multi-Teacher On-Policy Distillation

본 논문은 기존의 Customized Image Generation 분야에서 다수의 효과를 적용할 때 발생하는 스토리지 오버헤드, 라우팅 지연, 그리고 모듈 간 매개변수 간섭 문제를 해결하고자 합니다.

#Review #CollectionLoRA #Multi-Teacher Distillation #On-Policy Distillation #Diffusion Models #Few-step Generation #Concept Isolation

2026년 5월 28일

[논문리뷰] CoHyDE: Iterative Co-Training of LLM Rewriter & Dense Encoder for Tool Retrieval

본 논문은 LLM 에이전트의 tool retrieval 과정에서 발생하는 성능 병목 문제를 해결하기 위해 CoHyDE를 제안한다.

#Review #Tool Retrieval #LLM Agent #Dense Encoder #Co-training #Direct Preference Optimization (DPO)#Query Expansion

2026년 5월 28일