[논문리뷰] SEVerA: Verified Synthesis of Self-Evolving Agents본 연구는 FGGM을 핵심으로 하는 3단계 프레임워크인 SEVerA를 제안합니다. 첫째, Search 단계에서 Planner LLM이 로컬 제약 조건이 설정된 FGGM 기반의 Parametric Program을 합성합니다.#Review#LLM Agents#Automated Verification#Deductive Program Synthesis#Formally Guarded Generative Models#Constraint-Guided Synthesis2026년 4월 8일댓글 수 로딩 중
[논문리뷰] RAGEN-2: Reasoning Collapse in Agentic RL본 논문은 Mutual Information (MI) 기반의 진단 프레임워크와 SNR-Aware Filtering 기법을 제안한다. 연구진은 추론 품질을 Within-input diversity (Entropy)와 Cross-input distinguishability (MI)로 분해하여, 학습 과정에서 MI 프록시를 통해 템플릿 붕괴를 조기에 탐지한다 .#Review#Agentic RL#Reasoning Collapse#Mutual Information#Signal-to-Noise Ratio#Reward Variance#Template Collapse2026년 4월 8일댓글 수 로딩 중
[논문리뷰] R3PM-Net: Real-time, Robust, Real-world Point Matching NetworkarXiv에 게시된 'R3PM-Net: Real-time, Robust, Real-world Point Matching Network' 논문에 대한 자세한 리뷰입니다.#Review#Point Cloud Registration#Real-time#Feature Extraction#Industrial Automation#Event-camera#Robustness2026년 4월 8일댓글 수 로딩 중
[논문리뷰] Qualixar OS: A Universal Operating System for AI Agent Orchestration본 논문은 에이전트 워크플로우의 실행, 품질 보증, 모델 라우팅을 통합 관리하는 12단계 오케스트레이션 파이프라인과 Forge 엔진을 제안합니다 . Forge는 LLM 기반의 메타 인지 설계를 통해 태스크에 최적화된 에이전트 팀을 구성하며, 12가지의 다양한 실행 토폴로지를 제공하여 유연한 에이전트 협업을 구현합니다.#Review#Multi-agent Systems#Agent Orchestration#LLM Operating System#Topology Execution#Model Routing#Goodhart Detection#Behavioral Contracts2026년 4월 8일댓글 수 로딩 중
[논문리뷰] Q-Zoom: Query-Aware Adaptive Perception for Efficient Multimodal Large Language Models본 논문은 Q-Zoom이라는 2단계 적응형 프레임워크를 통해 시각적 인지 효율성을 개선한다. 첫 번째 단계인 Dynamic Gating Network는 consistency-aware 훈련 전략을 통해 고해상도 처리가 불필요한 쿼리를 식별하여 우회함으로써 불필요한 계산을 줄인다.#Review#Multimodal Large Language Models#Efficient Perception#Dynamic Gating#Region Proposal Network#Self-Distillation#High-Resolution Adaptation2026년 4월 8일댓글 수 로딩 중
[논문리뷰] Personalized RewardBench: Evaluating Reward Models with Human Aligned PersonalizationarXiv에 게시된 'Personalized RewardBench: Evaluating Reward Models with Human Aligned Personalization' 논문에 대한 자세한 리뷰입니다.#Review#Personalized RewardBench#Reward Modeling#Pluralistic Alignment#User Profile#Downstream Validation#Best-of-N#PPO2026년 4월 8일댓글 수 로딩 중
[논문리뷰] Neural Computers본 논문은 최신 비디오 생성 모델인 Wan2.1을 기반으로 인터페이스별 특화된 데이터 엔진과 학습 레시피를 적용하여 CLI와 GUI 환경에서의 NC 프로토타입을 구축하였다. 모델은 주어진 입력을 통해 latent state를 업데이트하고 다음 프레임을 생성하는 update-and-render 루프를 수행한다.#Review#Neural Computer#World Models#Interactive Video Generation#Latent Runtime State#CNC#CLI/GUI Interfaces2026년 4월 8일댓글 수 로딩 중
[논문리뷰] MoRight: Motion Control Done RightarXiv에 게시된 'MoRight: Motion Control Done Right' 논문에 대한 자세한 리뷰입니다.#Review#Video Generation#Disentangled Motion Control#Causal Motion Reasoning#Motion Dropout#Dual-stream Generation2026년 4월 8일댓글 수 로딩 중
[논문리뷰] MARS: Enabling Autoregressive Models Multi-Token GenerationarXiv에 게시된 'MARS: Enabling Autoregressive Models Multi-Token Generation' 논문에 대한 자세한 리뷰입니다.#Review#MARS#Autoregressive Model#Multi-Token Generation#Inference Acceleration#Block-Masked Prediction#Instruction-tuned LLM2026년 4월 8일댓글 수 로딩 중
[논문리뷰] Learning to Hint for Reinforcement LearningarXiv에 게시된 'Learning to Hint for Reinforcement Learning' 논문에 대한 자세한 리뷰입니다.#Review#Reinforcement Learning#Large Language Models#Reasoning#Hint Generation#Advantage Collapse#Transferability2026년 4월 8일댓글 수 로딩 중
[논문리뷰] Improving Semantic Proximity in Information Retrieval through Cross-Lingual AlignmentarXiv에 게시된 'Improving Semantic Proximity in Information Retrieval through Cross-Lingual Alignment' 논문에 대한 자세한 리뷰입니다.#Review#Cross-Lingual Information Retrieval#Semantic Alignment#Jensen-Shannon Divergence#InfoNCE#Multilingual Embedding Models#Language Bias2026년 4월 8일댓글 수 로딩 중
[논문리뷰] INSPATIO-WORLD: A Real-Time 4D World Simulator via Spatiotemporal Autoregressive ModelingHaoyu Ji이 arXiv에 게시한 'INSPATIO-WORLD: A Real-Time 4D World Simulator via Spatiotemporal Autoregressive Modeling' 논문에 대한 자세한 리뷰입니다.#Review#World Model#Spatiotemporal Autoregressive#Diffusion Transformer#Camera Control#Distribution Matching Distillation2026년 4월 8일댓글 수 로딩 중
[논문리뷰] FlowInOne:Unifying Multimodal Generation as Image-in, Image-out Flow MatchingLinjie Li이 arXiv에 게시한 'FlowInOne:Unifying Multimodal Generation as Image-in, Image-out Flow Matching' 논문에 대한 자세한 리뷰입니다.#Review#Multimodal Generation#Flow Matching#Visual Prompts#Image-in Image-out#Visual Instruction Following#VisPrompt-5M#VP-Bench2026년 4월 8일댓글 수 로딩 중
[논문리뷰] Fast Spatial Memory with Elastic Test-Time TrainingJoyce Chai이 arXiv에 게시한 'Fast Spatial Memory with Elastic Test-Time Training' 논문에 대한 자세한 리뷰입니다.#Review#4D Reconstruction#Test-Time Training#Elastic Weight Consolidation#Spatial Memory#Novel View Synthesis#Large Chunk Adaptation2026년 4월 8일댓글 수 로딩 중
[논문리뷰] FP4 Explore, BF16 Train: Diffusion Reinforcement Learning via Efficient Rollout Scaling본 논문은 탐색(exploration)과 최적화(optimization)를 분리한 Sol-RL이라는 2단계(two-stage) 프레임워크를 제안합니다 . 1단계에서는 고도로 최적화된 NVFP4 추론을 통해 방대한 후보군을 빠르게 생성하여 상대적 보상 순위를 매기고, 상위 및 하위의 contrastive subset을 선별합니다.#Review#Diffusion Models#Reinforcement Learning#FP4 Quantization#Rollout Scaling#Alignment#Efficiency#Two-stage Framework2026년 4월 8일댓글 수 로딩 중
[논문리뷰] DeonticBench: A Benchmark for Reasoning over Rules본 논문은 LLM이 자연어로 된 법령과 사실 관계를 Prolog 코드로 변환하여 심볼릭 솔버를 통해 해답을 도출하는 '솔버 지원 워크플로우'를 핵심 방법론으로 제안합니다. 평가를 위해 미국 연방 세금, 항공사 수하물 정책, 이민 행정, 주택법 등 4개 영역 6,232개의 태스크로 구성된 DEONTICBENCH를 구축하였습니다.#Review#Deontic Reasoning#LLM#Symbolic Computation#Prolog#Benchmark#High-stakes#Rule-based Reasoning2026년 4월 8일댓글 수 로딩 중
[논문리뷰] Beyond Hard Negatives: The Importance of Score Distribution in Knowledge Distillation for Dense Retrieval본 논문은 teacher 모델의 score 분포를 균등하게 유지하는 Stratified Sampling을 제안합니다. 이 방법은 전체 score 범위 내에서 사전에 정의된 quantile anchors에 가장 근접한 문서들을 선택하여 학습 데이터를 구성함으로써, 특정 점수대에 편향되지 않은 포괄적인 데이터 표본을 확보합니다 .#Review#Knowledge Distillation#Dense Retrieval#Stratified Sampling#Score Distribution#Information Retrieval#Generalization2026년 4월 8일댓글 수 로딩 중
[논문리뷰] AgentGL: Towards Agentic Graph Learning with LLMs via Reinforcement Learning본 논문은 RL 기반의 AgentGL 프레임워크를 제안하여 그래프 학습을 에이전트 의사결정 프로세스로 최적화한다. AgentGL은 그래프 기반 검색 도구들을 활용하여 다중 스케일 탐색을 수행하고, search-constrained thinking 메커니즘을 도입하여 불필요한 도구 호출을 줄이고 추론 정확도를 높인다.#Review#Agentic Graph Learning#Reinforcement Learning#Large Language Models#Graph-Native Search#Curriculum Learning2026년 4월 8일댓글 수 로딩 중
[논문리뷰] A Systematic Study of Cross-Modal Typographic Attacks on Audio-Visual ReasoningDeepti Ghadiyaram이 arXiv에 게시한 'A Systematic Study of Cross-Modal Typographic Attacks on Audio-Visual Reasoning' 논문에 대한 자세한 리뷰입니다.#Review#Multi-modal Large Language Models#Audio Typography#Adversarial Attack#Cross-modal Robustness#Semantic Steering#Safety Application#Content Moderation2026년 4월 8일댓글 수 로딩 중
[논문리뷰] A Frame is Worth One Token: Efficient Generative World Modeling with Delta Tokens저자들은 비디오 프레임 전체를 모델링하는 대신, 프레임 간의 '변화(Delta)'만을 압축하는 DeltaTok과 이를 기반으로 생성적 추론을 수행하는 DeltaWorld를 제안합니다. DeltaTok은 이전 프레임의 특징을 바탕으로 현재 프레임과의 차이를 단일 토큰으로 인코딩하여 비디오를 순수 시간적 시퀀스로 변환합니다 .#Review#Generative World Modeling#Delta Tokens#Visual Tokenization#Vision Foundation Models#Best-of-Many Training#Spatio-temporal Redundancy#Efficient Inference2026년 4월 8일댓글 수 로딩 중