[논문리뷰] Tadabur: A Large-Scale Quran Audio DatasetFaisaI이 arXiv에 게시한 'Tadabur: A Large-Scale Quran Audio Dataset' 논문에 대한 자세한 리뷰입니다.#Review2026년 4월 22일댓글 수 로딩 중
[논문리뷰] Scaling Test-Time Compute for Agentic CodingarXiv에 게시된 'Scaling Test-Time Compute for Agentic Coding' 논문에 대한 자세한 리뷰입니다.#Review#Test-Time Compute#Agentic Coding#Representation Learning#Recursive Tournament Voting (RTV)#Parallel-Distill-Refine (PDR)#Long-Horizon Agents#Inference-Time Scaling2026년 4월 22일댓글 수 로딩 중
[논문리뷰] SWE-chat: Coding Agent Interactions From Real Users in the Wild저자들은 GitHub 저장소에서 코딩 에이전트 세션을 자동으로 기록하는 오픈소스 도구인 Entire.io를 활용하여 데이터셋을 구축하였다. 수집된 데이터는 인간과 에이전트 간의 상세한 상호작용 추적(Interaction traces)과 라인별 코드 기여도 정보를 포함한다 .#Review#Coding Agents#Software Engineering#Human-Agent Interaction#In-the-wild Dataset#Code Attribution2026년 4월 22일댓글 수 로딩 중
[논문리뷰] Reward Hacking in the Era of Large Models: Mechanisms, Emergent Misalignment, ChallengesarXiv에 게시된 'Reward Hacking in the Era of Large Models: Mechanisms, Emergent Misalignment, Challenges' 논문에 대한 자세한 리뷰입니다.#Review#Reward Hacking#Alignment#RLHF#Proxy Compression Hypothesis#Emergent Misalignment#Large Models#Scalable Oversight2026년 4월 22일댓글 수 로딩 중
[논문리뷰] ReImagine: Rethinking Controllable High-Quality Human Video Generation via Image-First SynthesisarXiv에 게시된 'ReImagine: Rethinking Controllable High-Quality Human Video Generation via Image-First Synthesis' 논문에 대한 자세한 리뷰입니다.#Review#Human Video Generation#Image-First Synthesis#Flow Matching#Temporal Consistency#SMPL-X#Diffusion Transformer2026년 4월 22일댓글 수 로딩 중
[논문리뷰] Near-Future Policy OptimizationDingyu Yao이 arXiv에 게시한 'Near-Future Policy Optimization' 논문에 대한 자세한 리뷰입니다.#Review#Reinforcement Learning#RLVR#Mixed-Policy#Trajectory Quality#Variance Cost#Self-Taught RL#LLM Post-training2026년 4월 22일댓글 수 로딩 중
[논문리뷰] MMCORE: MultiModal COnnection with Representation Aligned Latent EmbeddingsYixuan Huang이 arXiv에 게시한 'MMCORE: MultiModal COnnection with Representation Aligned Latent Embeddings' 논문에 대한 자세한 리뷰입니다.#Review#Multimodal Generation#Vision-Language Model#Latent Embeddings#Diffusion Model#Representation Alignment#Unified Framework2026년 4월 22일댓글 수 로딩 중
[논문리뷰] LLaDA2.0-Uni: Unifying Multimodal Understanding and Generation with Diffusion Large Language ModelarXiv에 게시된 'LLaDA2.0-Uni: Unifying Multimodal Understanding and Generation with Diffusion Large Language Model' 논문에 대한 자세한 리뷰입니다.#Review#Multimodal Foundation Model#Diffusion Large Language Model#SigLIP-VQ#Unified Architecture#Block-wise Masked Diffusion2026년 4월 22일댓글 수 로딩 중
[논문리뷰] Exploring Spatial Intelligence from a Generative PerspectiveZekai Luo이 arXiv에 게시한 'Exploring Spatial Intelligence from a Generative Perspective' 논문에 대한 자세한 리뷰입니다.#Review#Generative Spatial Intelligence#Multimodal Large Language Models#Image Editing#Benchmark#Sim-to-Real Transfer2026년 4월 22일댓글 수 로딩 중
[논문리뷰] Diverse Dictionary LearningarXiv에 게시된 'Diverse Dictionary Learning' 논문에 대한 자세한 리뷰입니다.#Review#Diverse Dictionary Learning#Identifiability#Latent Variable Models#Nonlinear ICA#Jacobian Sparsity#Disentangled Representation2026년 4월 22일댓글 수 로딩 중
[논문리뷰] DeVI: Physics-based Dexterous Human-Object Interaction via Synthetic Video Imitation저자들은 텍스트 기반의 합성 비디오에서 hybrid imitation target을 추출하여 이를 통해 humanoid control policy를 학습하는 DeVI 프레임워크를 제안합니다 . 우선 3D 인간 모델과 물체를 포함한 씬에서 텍스트 프롬프트를 사용하여 2D HOI 비디오를 생성합니다.#Review#Dexterous Manipulation#Video Generative Models#Physics-based Simulation#Reinforcement Learning#Human-Object Interaction2026년 4월 22일댓글 수 로딩 중
[논문리뷰] DR-Venus: Towards Frontier Edge-Scale Deep Research Agents with Only 10K Open Data저자들은 10K 규모의 Open Data만을 사용하여 4B 규모의 DR-Venus를 훈련하는 2단계 파이프라인을 제안한다. 첫 번째 단계인 Agentic SFT에서는 데이터 정제와 long-horizon 궤적 재샘플링(turn-aware resampling)을 통해 모델의 기초 능력을 확립한다.#Review#Deep Research Agents#Edge-Scale Models#Open Data#Reinforcement Learning#Information Gain#Supervised Fine-Tuning2026년 4월 22일댓글 수 로딩 중
[논문리뷰] CreativeGame:Toward Mechanic-Aware Creative Game GenerationYiwei Shi이 arXiv에 게시한 'CreativeGame:Toward Mechanic-Aware Creative Game Generation' 논문에 대한 자세한 리뷰입니다.#Review#Creative Game Generation#Multi-agent System#Mechanic-Aware#Iterative Evolution#CreativeProxyReward#Runtime Validation#Lineage-Aware Memory2026년 4월 22일댓글 수 로딩 중
[논문리뷰] Cortex 2.0: Grounding World Models in Real-World Industrial Deployment본 논문은 로봇 제어 루프에 월드 모델을 통합하여 미래 예측과 평가 과정을 추가하는 Cortex 2.0 아키텍처를 제안합니다 . 제안 모델은 현재 관측치를 바탕으로 월드 모델을 통해 $k$개의 미래 궤적 후보를 잠재 공간(Visual latent space)에서 생성합니다.#Review#Vision-Language-Action Models#World Models#Robotic Manipulation#Plan-and-Act#Process-Reward Operator#Flow Matching#Cross-Embodiment2026년 4월 22일댓글 수 로딩 중
[논문리뷰] Convergent Evolution: How Different Language Models Learn Similar Number RepresentationsarXiv에 게시된 'Convergent Evolution: How Different Language Models Learn Similar Number Representations' 논문에 대한 자세한 리뷰입니다.#Review#Language Models#Mechanistic Interpretability#Fourier Features#Convergent Evolution#Modular Arithmetic#Representation Learning2026년 4월 22일댓글 수 로딩 중
[논문리뷰] A Self-Evolving Framework for Efficient Terminal Agents via Observational Context CompressionarXiv에 게시된 'A Self-Evolving Framework for Efficient Terminal Agents via Observational Context Compression' 논문에 대한 자세한 리뷰입니다.#Review#Terminal Agents#Context Compression#Self-evolving Framework#Token Efficiency#Long-horizon Reasoning#Training-free2026년 4월 22일댓글 수 로딩 중
[논문리뷰] UniMesh: Unifying 3D Mesh Understanding and Generation본 논문은 3D 생성과 이해를 하나의 아키텍처 내에서 통합하고 상호 강화할 수 있는 UniMesh를 제안합니다. Mesh Head를 도입하여 BAGEL의 latent와 Hunyuan3D의 conditioning latent를 직접 매핑함으로써 정보 손실을 최소화하고 기하학적 정밀도를 유지합니다.#Review#3D Generation#3D Understanding#Mesh Head#Chain-of-Mesh#Self-Reflection#Multimodal Learning2026년 4월 21일댓글 수 로딩 중
[논문리뷰] Understanding and Enforcing Weight Disentanglement in Task ArithmeticarXiv에 게시된 'Understanding and Enforcing Weight Disentanglement in Task Arithmetic' 논문에 대한 자세한 리뷰입니다.#Review#Task Arithmetic#Weight Disentanglement#Model Merging#Orthogonal Regularization#Task-Feature Specialization2026년 4월 21일댓글 수 로딩 중
[논문리뷰] UDM-GRPO: Stable and Efficient Group Relative Policy Optimization for Uniform Discrete Diffusion Models본 논문은 `UDM`과 `GRPO`를 안정적으로 통합하기 위해 UDM-GRPO 프레임워크를 제안합니다. 첫째, 모든 타임스텝에서 액션을 중간 예측치가 아닌 최종 정제 샘플 `x_hat_1`으로 재정의하여 보상 일관성과 최적화 정밀도를 높였습니다 .#Review#Uniform Discrete Diffusion Model#Reinforcement Learning#GRPO#Text-to-Image Generation#Policy Optimization#Distribution Alignment2026년 4월 21일댓글 수 로딩 중
[논문리뷰] The Cognitive Penalty: Ablating System 1 and System 2 Reasoning in Edge-Native SLMs for Decentralized Consensus저자들은 Qwen-3.5-9B를 기반으로 Sentinel-Bench라는 평가 프레임워크를 구축하여 System 1과 System 2 간의 성능을 정량적으로 비교 분석하였다. 동일한 파라미터 환경에서 reasoning toggle만을 조정하여 840번의 독립적인 추론을 수행하였다.#Review#Small Language Models#Decentralized Autonomous Organizations#Inference-time Compute#System 1 vs System 2#Sentinel-Bench#Adversarial Robustness#Cognitive Collapse2026년 4월 21일댓글 수 로딩 중