Review

[논문리뷰] When the Chain of Thought Knows Better: Failure Modes in Multi-Turn Reasoning Models

본 연구는 Multi-turn Reasoning 환경에서 모델의 CoT가 실제 최종 답변의 정확도를 보장하지 않으며, 오히려 논리적 모순을 유발할 수 있다는 점을 문제로 제기합니다.

#Review #Multi-turn Reasoning #Chain of Thought #Failure Modes #Faithfulness #LLM Evaluation

2026년 6월 9일

[논문리뷰] What Should Agents Say? Action-state Communication for Efficient Multi-Agent Systems

Chen Huang이 arXiv에 게시한 'What Should Agents Say? Action-state Communication for Efficient Multi-Agent Systems' 논문에 대한 자세한 리뷰입니다.

#Review #Multi-Agent Systems #Communication Protocol #Action-state

2026년 6월 9일

[논문리뷰] UniPET: a universal network for high-quality PET image denoising across varied dose reduction factors

본 연구는 고정된 노이즈 수준에 맞춰진 기존 PET 노이즈 제거 모델들이 다양한 임상적 상황에서의 변동성에 효과적으로 대응하지 못한다는 문제점을 해결하고자 합니다.

#Review #PET Image Denoising #Universal Network #Dose Reduction #Deep Learning #Medical Imaging

2026년 6월 9일

[논문리뷰] U-TTT: Towards Generalizable PET Image Denoising via Test-Time Training

본 논문은 기존의 Supervised Learning 기반 PET Denoising 모델들이 훈련 데이터와 테스트 데이터 간의 Domain Shift가 발생할 경우 성능이 급격히 저하되는 문제를 해결하고자 합니다.

#Review #PET Image Denoising #Test-Time Training #Generalization #Deep Learning #Unsupervised Learning #Medical Imaging

2026년 6월 9일

[논문리뷰] The Role of Feedback Alignment in Self-Distillation

본 연구는 신경망 훈련 시 대규모 연산 자원이 필요한 Backpropagation의 의존성을 줄이고, Self-Distillation 과정에서의 효율성을 극대화하기 위해 수행되었다.

#Review #Self-Distillation #Feedback Alignment #Backpropagation #Knowledge Distillation #Deep Learning

2026년 6월 9일

[논문리뷰] Test-Time Gradient Guidance of Flow Policies in Reinforcement Learning

본 논문은 표준적인 RL 정책(Policy)이 학습 이후 고정된 분포에서 액션을 샘플링하여 복잡한 제약 조건이나 급변하는 환경에서 최적 성능을 달성하지 못하는 한계를 해결하고자 합니다.

#Review #Reinforcement Learning #Flow Policies #Test-Time Guidance #Gradient-based Optimization #Trajectory Optimization #Policy Search

2026년 6월 9일

[논문리뷰] Struct-Searcher: Agentic Structural Thinking Advances Multimodal Deep Information Seeking

본 논문은 현대의 멀티모달 딥 리서치 시스템이 정보 수집 과정에서 발생하는 Cross-modal conflict를 적절히 해결하지 못하는 '지식적 경직성(epistemic rigidity)' 문제를 해결하고자 합니다.

#Review #Multimodal #Deep Research Agents #Belief Revision Theory #Structural Thinking #Multimodal Structural Graph (MSG)#Conflict-aware

2026년 6월 9일

[논문리뷰] SearchSwarm: Towards Delegation Intelligence in Agentic LLMs for Long-Horizon Deep Research

죄송합니다. 현재 요청하신 논문(arXiv:2606.09730)에 대한 실시간 접근이 제한되어 내용을 직접 분석할 수 없습니다. 이는 해당 논문이 매우 최근에 게시되었거나, 아카이브 시스템 상의 일시적인 접근 제한 문제일 가능성이 높습니다.

2026년 6월 9일

[논문리뷰] SCAIL-2: Unifying Controlled Character Animation with End-to-end In-Context Conditioning

본 요청사항에 따라 해당 논문을 분석하려 하였으나, 현재 제공해주신 URL(https://arxiv.org/html/2606.10804)에 대한 직접적인 접근이 기술적 제한으로 인해 불가능합니다.

2026년 6월 9일

[논문리뷰] Role-Agent: Bootstrapping LLM Agents via Dual-Role Evolution

본 연구는 고성능 LLM Agents를 구축하는 과정에서 직면하는 데이터 희소성과 정밀한 추론 전략의 부재를 해결하는 데 초점을 둡니다.

#Review #LLM Agents #Dual-Role Evolution #Self-Play #Knowledge Bootstrapping #Task Planning #Iterative Refinement

2026년 6월 9일

[논문리뷰] Retrospective Harness Optimization: Improving LLM Agents via Self-Preference over Trajectory Rollouts

본 연구는 복잡한 Task를 수행하는 LLM Agent가 고정된 추론 방식에 의존하여 Suboptimal한 경로를 생성하는 문제를 해결하고자 한다.

#Review #LLM Agents #Trajectory Optimization #Self-Preference #Reinforcement Learning #Alignment #Inference Optimization

2026년 6월 9일

[논문리뷰] Rethinking the Divergence Regularization in LLM RL

죄송합니다. 현재 제공해주신 논문 URL(https://arxiv.org/html/2606.09821)에 대해 직접적인 접근이 제한되어 내용을 분석할 수 없습니다.

2026년 6월 9일

[논문리뷰] PsychoSafe: Eliciting Psychologically-Informed Refusals in Large Language Models

본 연구는 현재 LLM의 거절 방식이 지나치게 정형화되어 있어 사용자의 반발을 유발하거나, 의도치 않게 안전 필터를 우회당하는 취약점을 안고 있다는 문제에서 출발한다.

#Review #LLM Safety #Psychology-Informed #Refusal Strategy #Alignment #Red Teaming #Cognitive Science #AI Ethics

2026년 6월 9일

[논문리뷰] Online Skill Learning for Web Agents via State-Grounded Dynamic Retrieval

본 연구는 기존 Web Agent가 복잡하고 동적인 웹 환경에서 일반화된 지식의 한계로 인해 특정 도메인이나 새로운 인터페이스 적응에 실패하는 문제를 해결하고자 합니다.

#Review #Web Agents #Online Skill Learning #Dynamic Retrieval #State-Grounded #Sequential Decision Making #Skill Library #LLM

2026년 6월 9일

[논문리뷰] One Token per Multimodal Evidence: Latent Memory for Resource-Constrained QA

멀티모달 질의응답 시스템은 고해상도 시각적 입력과 긴 컨텍스트 처리에 따른 과도한 컴퓨팅 리소스 소모로 인해 실시간 서비스 구현에 한계를 겪고 있습니다. 기존의 Visual Language Models (VLM)은 멀티모달 입력을 처리할 때 너무 많은 토큰을 생성하여 Latency와 Throughput 저하를 유발합니다.

#Review #Multimodal QA #Latent Memory #Resource-Constrained #Token Efficiency #Evidence Retrieval #Visual Language Model

2026년 6월 9일

[논문리뷰] Next Forcing: Causal World Modeling with Multi-Chunk Prediction

본 논문은 기존 Autoregressive 모델이 긴 시퀀스를 생성할 때 발생하는 높은 Latency와 연산 비효율성 문제를 해결한다. 전통적인 모델은 토큰을 하나씩 생성해야 하므로, 복잡한 환경을 시뮬레이션하거나 긴 문맥을 생성할 때 병목 현상이 발생한다.

#Review #World Modeling #Multi-Chunk Prediction #Causal Modeling #Autoregressive Generation #Sequence Modeling

2026년 6월 9일

[논문리뷰] MilliVid: Hierarchical Latents for Long-Range Consistency in Video Generation

본 논문은 기존 비디오 생성 모델들이 직면한 긴 영상 생성 시 발생하는 Temporal Inconsistency와 정보의 누락 문제를 해결하고자 합니다. 기존의 프레임 단위 또는 짧은 세그먼트 기반의 생성 방식은 시간이 지날수록 전역적 구조를 잃어버리는 한계가 있습니다.

#Review #Video Generation #Hierarchical Latents #Long-Range Consistency #Diffusion Models #Latent Space #Spatiotemporal Modeling

2026년 6월 9일

[논문리뷰] MemDreamer: Decoupling Perception and Reasoning for Long Video Understanding via Hierarchical Graph Memory and Agentic Retrieval Mechanism

본 논문은 기존 Vision-Language Models(VLMs)가 긴 영상을 처리할 때 발생하는 토큰 폭발과 주의력 희석(Attention Dilution) 문제를 해결하고자 합니다.

#Review #Long Video Understanding #Hierarchical Graph Memory #Agentic Retrieval #Vision-Language Models #Decoupled Perception and Reasoning

2026년 6월 9일

[논문리뷰] Lip Forcing: Few-Step Autoregressive Diffusion for Real-time Lip Synchronization

본 논문은 기존 Diffusion 기반의 오디오-비디오 생성 모델이 가진 높은 Latency와 연산 복잡도 문제를 해결하는 것을 목표로 합니다. 기존 방식은 고품질의 출력을 생성하기 위해 수십 번의 Sampling Step이 필요하여 실시간 서비스에 적용하기 어렵습니다.

#Review #Lip Synchronization #Diffusion Models #Autoregressive #Real-time #Audio-Driven Talking Face

2026년 6월 9일

[논문리뷰] Late-Layer Fusion is Enough: Dual-Path Vision Token Routing for Multimodal Large Language Models under Visual Saturation

본 논문은 MLLM에서 발생하는 Visual Saturation 문제를 해결하기 위해 Dual-Path Vision Token Routing을 도입하여 성능과 효율성을 동시에 최적화한다.

#Review #Multimodal Large Language Models #Visual Saturation #Vision Token Routing #Late-Layer Fusion #Dual-Path Architecture #Computational Efficiency

2026년 6월 9일