[논문리뷰] SuperLocalMemory V3.3: The Living Brain -- Biologically-Inspired Forgetting, Cognitive Quantization, and Multi-Channel Retrieval for Zero-LLM Agent Memory Systems본 논문은 정보 기하학에 기반한 FRQAD와 Local TurboQuant를 도입하여 메모리 저장 효율과 검색 정밀도를 동시에 달성한다. 저자들은 Fokker-Planck 동역학을 활용하여 메모리의 수명 주기를 수학적으로 관리하며, 이를 통해 고정밀에서 저정밀(32-bit에서 2-bit까지)로 이어지는 단계적 메모리 압축을 구현한다.#Review#Agent Memory#Information Geometry#Vector Quantization#Ebbinghaus Forgetting#Cognitive Architecture#Soft Prompts#Fisher-Rao2026년 4월 16일댓글 수 로딩 중
[논문리뷰] RadAgent: A tool-using AI agent for stepwise interpretation of chest computed tomography본 논문은 Reinforcement Learning을 통해 최적의 도구 사용 전략을 자동 학습하는 RadAgent 프레임워크를 제안합니다. RadAgent는 초기 보고서 초안을 작성한 후, 임상 진단 체크리스트를 기반으로 단계별 에이전트 루프를 거치며 필요한 도구를 호출하고 결과를 업데이트합니다 .#Review#RadAgent#Reinforcement Learning#Vision-Language Models#Chest CT#Medical Report Generation#Tool-using AI Agent#Faithfulness#Robustness2026년 4월 16일댓글 수 로딩 중
[논문리뷰] OneHOI: Unifying Human-Object Interaction Generation and EditingarXiv에 게시된 'OneHOI: Unifying Human-Object Interaction Generation and Editing' 논문에 대한 자세한 리뷰입니다.#Review#Human-Object Interaction#Diffusion Transformer#Image Editing#Unified Framework#Relational Modeling#Spatial Control2026년 4월 16일댓글 수 로딩 중
[논문리뷰] Model Capability Dominates: Inference-Time Optimization Lessons from AIMO 3natnitaract이 arXiv에 게시한 'Model Capability Dominates: Inference-Time Optimization Lessons from AIMO 3' 논문에 대한 자세한 리뷰입니다.#Review#LLM#Mathematical Reasoning#Inference-Time Optimization#Majority Voting#Self-Consistency#Diverse Prompting2026년 4월 16일댓글 수 로딩 중
[논문리뷰] MM-WebAgent: A Hierarchical Multimodal Web Agent for Webpage GenerationNing Liao이 arXiv에 게시한 'MM-WebAgent: A Hierarchical Multimodal Web Agent for Webpage Generation' 논문에 대한 자세한 리뷰입니다.#Review#Multimodal Web Agent#Hierarchical Planning#Self-Reflection#Webpage Generation#AIGC2026년 4월 16일댓글 수 로딩 중
[논문리뷰] LongAct: Harnessing Intrinsic Activation Patterns for Long-Context Reinforcement LearningChenxuan Li이 arXiv에 게시한 'LongAct: Harnessing Intrinsic Activation Patterns for Long-Context Reinforcement Learning' 논문에 대한 자세한 리뷰입니다.#Review#Reinforcement Learning#Large Language Models#Long-context#Sparsity#Activation Patterns#Saliency-guided2026년 4월 16일댓글 수 로딩 중
[논문리뷰] LeapAlign: Post-Training Flow Matching Models at Any Generation Step by Building Two-Step TrajectoriesarXiv에 게시된 'LeapAlign: Post-Training Flow Matching Models at Any Generation Step by Building Two-Step Trajectories' 논문에 대한 자세한 리뷰입니다.#Review#Flow Matching#Preference Alignment#Direct-Gradient Method#Leap Trajectory#Trajectory-Similarity Weighting#Gradient Discounting2026년 4월 16일댓글 수 로딩 중
[논문리뷰] KV Packet: Recomputation-Free Context-Independent KV Caching for LLMsarXiv에 게시된 'KV Packet: Recomputation-Free Context-Independent KV Caching for LLMs' 논문에 대한 자세한 리뷰입니다.#Review#LLM#KV Cache#RAG#Recomputation-Free#Soft-token Adapter#Self-Supervised Distillation#Attention Dynamics2026년 4월 16일댓글 수 로딩 중
[논문리뷰] Cross-Tokenizer LLM Distillation through a Byte-Level InterfaceDavide Buffelli이 arXiv에 게시한 'Cross-Tokenizer LLM Distillation through a Byte-Level Interface' 논문에 대한 자세한 리뷰입니다.#Review#Cross-Tokenizer Distillation#Byte-Level Interface#Knowledge Distillation#LLM#Vocabulary Mismatch2026년 4월 16일댓글 수 로딩 중
[논문리뷰] C2: Scalable Rubric-Augmented Reward Modeling from Binary Preferences본 논문은 Rubric 생성과 Rubric 기반 검증을 협력적이지만 비판적인 의사소통 과정으로 재정의합니다. 제안 방법론인 C2는 우선 Verifier의 신뢰도를 기준으로 Rubric을 Helpful한 것과 Misleading한 것으로 합성한 후, 이 쌍을 활용하여 Generator를 DPO로 학습시키고 Verifier를 GRPO로 학습시킵니다 .#Review#Reward Modeling#Reinforcement Learning from Human Feedback (RLHF)#Rubric-Augmented Verification#Binary Preferences#Cooperative Communication2026년 4월 16일댓글 수 로딩 중
[논문리뷰] Target Policy OptimizationJean Kaddour이 arXiv에 게시한 'Target Policy Optimization' 논문에 대한 자세한 리뷰입니다.#Review#Target Policy Optimization#Sparse Reward#Policy Gradient#Cross-Entropy#RLVR#Grouped RL2026년 4월 15일댓글 수 로딩 중
[논문리뷰] SpatialEvo: Self-Evolving Spatial Intelligence via Deterministic Geometric EnvironmentsXinrui Cheng이 arXiv에 게시한 'SpatialEvo: Self-Evolving Spatial Intelligence via Deterministic Geometric Environments' 논문에 대한 자세한 리뷰입니다.#Review#Spatial Reasoning#Self-Evolution#Vision-Language Models#Deterministic Geometric Environment#Reinforcement Learning2026년 4월 15일댓글 수 로딩 중
[논문리뷰] Sema Code: Decoupling AI Coding Agents into Programmable, Embeddable InfrastructurearXiv에 게시된 'Sema Code: Decoupling AI Coding Agents into Programmable, Embeddable Infrastructure' 논문에 대한 자세한 리뷰입니다.#Review#AI Coding Agents#Embeddable Infrastructure#Decoupled Architecture#Multi-tenant Isolation#Context Compression#Agent Runtime2026년 4월 15일댓글 수 로딩 중
[논문리뷰] Seedance 2.0: Advancing Video Generation for World ComplexityarXiv에 게시된 'Seedance 2.0: Advancing Video Generation for World Complexity' 논문에 대한 자세한 리뷰입니다.#Review#Video Generation#Multimodal Foundation Model#Audio-Video Joint Generation#Controllability#Generative AI#Real-world Complexity2026년 4월 15일댓글 수 로딩 중
[논문리뷰] RationalRewards: Reasoning Rewards Scale Visual Generation Both Training and Test TimeFangzhen Lin이 arXiv에 게시한 'RationalRewards: Reasoning Rewards Scale Visual Generation Both Training and Test Time' 논문에 대한 자세한 리뷰입니다.#Review#RationalRewards#Preference-Anchored Rationalization#Visual Generation#Reasoning-based Reward Model#Reinforcement Learning#Prompt Tuning2026년 4월 15일댓글 수 로딩 중
[논문리뷰] OccuBench: Evaluating AI Agents on Real-World Professional Tasks via Language World ModelsarXiv에 게시된 'OccuBench: Evaluating AI Agents on Real-World Professional Tasks via Language World Models' 논문에 대한 자세한 리뷰입니다.#Review#AI Agents#Language World Models#Professional Tasks#Environmental Robustness#Fault Injection#Benchmark2026년 4월 15일댓글 수 로딩 중
[논문리뷰] Memory Transfer Learning: How Memories are Transferred Across Domains in Coding AgentsarXiv에 게시된 'Memory Transfer Learning: How Memories are Transferred Across Domains in Coding Agents' 논문에 대한 자세한 리뷰입니다.#Review#Coding Agents#Self-evolving Agents#Memory Transfer Learning#Cross-domain#Meta-knowledge#Abstraction#Transferability2026년 4월 15일댓글 수 로딩 중
[논문리뷰] GameWorld: Towards Standardized and Verifiable Evaluation of Multimodal Game AgentsarXiv에 게시된 'GameWorld: Towards Standardized and Verifiable Evaluation of Multimodal Game Agents' 논문에 대한 자세한 리뷰입니다.#Review#Multimodal Large Language Model#Game Agent#Benchmark#Standardized Evaluation#Computer-Use Agent#Semantic Action Parsing#Outcome-based Evaluation2026년 4월 15일댓글 수 로딩 중
[논문리뷰] From P(y|x) to P(y): Investigating Reinforcement Learning in Pre-train SpacearXiv에 게시된 'From P(y|x) to P(y): Investigating Reinforcement Learning in Pre-train Space' 논문에 대한 자세한 리뷰입니다.#Review#Large Language Models#Reinforcement Learning#Pre-train Space#Policy Reincarnation#Negative Sample Reinforcement#Reasoning Enhancement2026년 4월 15일댓글 수 로딩 중
[논문리뷰] Free Geometry: Refining 3D Reconstruction from Longer Versions of ItselfarXiv에 게시된 'Free Geometry: Refining 3D Reconstruction from Longer Versions of Itself' 논문에 대한 자세한 리뷰입니다.#Review#Test-Time Adaptation#Multi-View 3D Reconstruction#Self-Supervision#LoRA#Feature Consistency#Feed-Forward Models2026년 4월 15일댓글 수 로딩 중