[논문리뷰] Rethinking UMM Visual Generation: Masked Modeling for Efficient Image-Only Pre-training기존 UMM visual generation component의 pre-training은 비효율적인 paradigm과 희소하며 높은 품질의 text-image paired data에 대한 의존성이라는 중대한 제약에 직면해 있습니다.#Review2026년 3월 17일댓글 수 로딩 중
[논문리뷰] Recursive Language Models Meet Uncertainty: The Surprising Effectiveness of Self-Reflective Program Search for Long ContextLarge Language Models (LLMs)는 extended context windows에도 불구하고 long context 내 정보를 신뢰성 있게 추출하고, 추론하며, 활용하는 데 어려움을 겪고 있다.#Review2026년 3월 17일댓글 수 로딩 중
[논문리뷰] Qianfan-OCR: A Unified End-to-End Model for Document Intelligence기존의 OCR 시스템은 비용, 정확도, 기능성 측면에서 Trade-off를 겪고 있습니다.#Review2026년 3월 17일댓글 수 로딩 중
[논문리뷰] Online Experiential Learning for Language Models현재 대규모 언어 모델(LLM) 개선 패러다임은 주로 offline training에 의존하며, 인간 annotation 또는 simulated environment를 활용합니다. 그러나 이러한 방식은 실제 배포 환경에서 축적되는 풍부한 경험을 전혀 활용하지 못한다는 근본적인 한계가 있습니다.#Review#Online Experiential Learning (OEL)#Context Distillation#Language Models#Reward-Free Learning#Catastrophic Forgetting#Token Efficiency#On-Policy Learning2026년 3월 17일댓글 수 로딩 중
[논문리뷰] One-Eval: An Agentic System for Automated and Traceable LLM EvaluationLarge Language Models (LLMs)의 산업 시스템 도입이 가속화됨에 따라 reliable evaluation 은 model lifecycle 전반에 걸쳐 critical한 구성 요소가 되었습니다. 그러나 현재의 evaluation practices는 상당한 manual effort 를 요구합니다.#Review2026년 3월 17일댓글 수 로딩 중
[논문리뷰] Mixture of Style Experts for Diverse Image Stylization기존의 Diffusion-based Stylization 방법론들은 이미지의 Color Transfer 에 주로 집중하여 Complex Semantics 및 Material Details 를 효과적으로 처리하지 못하는 한계가 있었습니다.#Review#Image Stylization#Mixture of Experts (MoE)#Diffusion Models#Semantic-aware Stylization#Style Transfer#LoRA2026년 3월 17일댓글 수 로딩 중
[논문리뷰] MiroThinker-1.7 & H1: Towards Heavy-Duty Research Agents via Verification최근 Large Language Models (LLMs)는 유창한 텍스트 생성 및 광범위한 질문 답변 능력에서 상당한 발전을 이루었지만, scientific analysis, financial reasoning, open-ended research와 같은 많은 real-world 문제들은 단순한 conversational ability를 넘어선다.#Review#Research Agents#Long-Horizon Reasoning#Verification#Agentic LLM#Multi-Step Problem Solving#Reinforcement Learning2026년 3월 17일댓글 수 로딩 중
[논문리뷰] M^3: Dense Matching Meets Multi-View Foundation Models for Monocular Gaussian Splatting SLAMuncalibrated monocular video로부터 streaming reconstruction을 수행하는 것은 고정밀 pose estimation과 동적 환경에서의 계산적으로 효율적인 online refinement가 모두 필요하므로 여전히 challenging합니다.#Review#SLAM#Streaming Reconstruction#3D Gaussian Splatting#Monocular Video#Foundation Models#Dense Matching2026년 3월 17일댓글 수 로딩 중
[논문리뷰] Kinema4D: Kinematic 4D World Modeling for Spatiotemporal Embodied SimulationEmbodied AI 분야에서 로봇 trajectory를 세계 환경 내에서 roll out하는 능력은 demonstration 확장, policy evaluation 및 reinforcement learning에 매우 중요합니다.#Review#Embodied AI#4D Generative World Model#Spatiotemporal-aware#Kinematic Control#Robotic Simulation#Diffusion Transformer#Pointmap2026년 3월 17일댓글 수 로딩 중
[논문리뷰] InCoder-32B: Code Foundation Model for Industrial Scenarios최근 코드 대규모 언어 모델(LLMs)은 일반적인 프로그래밍 task에서 상당한 발전을 이루었지만, 하드웨어 의미론, 특수 언어 구성체 및 엄격한 자원 제약 조건에 대한 추론이 필요한 산업 시나리오에서는 그 성능이 크게 저하되는 문제를 겪고 있습니다.#Review#Code Foundation Model#Industrial Scenarios#Chip Design#GPU Kernel Optimization#Embedded Systems#Compiler Optimization#3D Modeling#Code Intelligence2026년 3월 17일댓글 수 로딩 중
[논문리뷰] GradMem: Learning to Write Context into Memory with Test-Time Gradient Descent최근 Large Language Model(LLM) 애플리케이션들은 방대한 외부 컨텍스트에 의존하며, 이는 KV-cache 와 같은 방식으로 처리될 경우 상당한 메모리 오버헤드를 발생시킵니다.#Review#GradMem#Test-Time Optimization#Context Removal#Compressive Memory#Meta-learning#Gradient Descent#LLM#KV-retrieval2026년 3월 17일댓글 수 로딩 중
[논문리뷰] FinToolBench: Evaluating LLM Agents for Real-World Financial Tool UseLarge Language Models (LLMs)의 금융 도메인 통합은 정적 정보 검색에서 동적이고 에이전트적인 상호작용으로의 paradigm shift 를 주도하고 있습니다.#Review2026년 3월 17일댓글 수 로딩 중
[논문리뷰] Efficient Reasoning on the EdgeLarge Language Models (LLMs)는 Chain-of-Thought (CoT) Reasoning을 통해 복잡한 문제 해결에서 최첨단 성능을 달성하지만, Edge Device 배포에는 여러 제약이 따릅니다.#Review#LLMs#Edge Computing#LoRA#Quantization#Budget Forcing#Switcher Module#Parallel Reasoning2026년 3월 17일댓글 수 로딩 중
[논문리뷰] Demystifing Video Reasoning최근 Diffusion 기반 비디오 생성 모델이 Spatiotemporally Consistent한 시각 환경에서 비 trivial한 Reasoning 능력을 보이는 현상이 발견되었습니다.#Review#Video Reasoning#Diffusion Models#Chain-of-Steps#Emergent Behaviors#Layer Specialization#Training-Free Ensemble2026년 3월 17일댓글 수 로딩 중
[논문리뷰] AgentProcessBench: Diagnosing Step-Level Process Quality in Tool-Using AgentsLLMs가 tool-using agent로 발전하면서 외부 환경과 상호작용하는 능력은 크게 향상되었지만, long-horizon 상호작용에서는 여전히 취약합니다.#Review#Large language models#Process reward models#Tool-using agents#Step-level evaluation#Agent trajectories#Benchmark2026년 3월 17일댓글 수 로딩 중
[triton] AMD gfx1250에서 Async Copy와 TDM 경로의 Padded Layout 휴리스틱 통합AMD gfx1250 GPU의 async copy와 TDM 로드 경로에서 사용되는 padded shared memory layout 선택 휴리스틱을 통합한 PR 분석.#Triton#AMD#gfx1250#SharedMemory#Padding#BankConflict2026년 3월 17일댓글 수 로딩 중
[Ray Data] RAPIDS MPF 기반 GPU 셔플 지원으로 GPU 데이터 처리 파이프라인 가속CPU 경유 없이 GPU 메모리에서 직접 해시 셔플을 수행하는 GPUShuffleOperator를 추가하여 대규모 분산 GPU 데이터 처리를 가속하는 기능 분석.#Ray#Python#Performance#GPU#Distributed Systems2026년 3월 17일댓글 수 로딩 중