[논문리뷰] InCoder-32B: Code Foundation Model for Industrial Scenarios최근 코드 대규모 언어 모델(LLMs)은 일반적인 프로그래밍 task에서 상당한 발전을 이루었지만, 하드웨어 의미론, 특수 언어 구성체 및 엄격한 자원 제약 조건에 대한 추론이 필요한 산업 시나리오에서는 그 성능이 크게 저하되는 문제를 겪고 있습니다.#Review#Code Foundation Model#Industrial Scenarios#Chip Design#GPU Kernel Optimization#Embedded Systems#Compiler Optimization#3D Modeling#Code Intelligence2026년 3월 17일댓글 수 로딩 중
[논문리뷰] GradMem: Learning to Write Context into Memory with Test-Time Gradient Descent최근 Large Language Model(LLM) 애플리케이션들은 방대한 외부 컨텍스트에 의존하며, 이는 KV-cache 와 같은 방식으로 처리될 경우 상당한 메모리 오버헤드를 발생시킵니다.#Review#GradMem#Test-Time Optimization#Context Removal#Compressive Memory#Meta-learning#Gradient Descent#LLM#KV-retrieval2026년 3월 17일댓글 수 로딩 중
[논문리뷰] FinToolBench: Evaluating LLM Agents for Real-World Financial Tool UseLarge Language Models (LLMs)의 금융 도메인 통합은 정적 정보 검색에서 동적이고 에이전트적인 상호작용으로의 paradigm shift 를 주도하고 있습니다.#Review2026년 3월 17일댓글 수 로딩 중
[논문리뷰] Efficient Reasoning on the EdgeLarge Language Models (LLMs)는 Chain-of-Thought (CoT) Reasoning을 통해 복잡한 문제 해결에서 최첨단 성능을 달성하지만, Edge Device 배포에는 여러 제약이 따릅니다.#Review#LLMs#Edge Computing#LoRA#Quantization#Budget Forcing#Switcher Module#Parallel Reasoning2026년 3월 17일댓글 수 로딩 중
[논문리뷰] Demystifing Video Reasoning최근 Diffusion 기반 비디오 생성 모델이 Spatiotemporally Consistent한 시각 환경에서 비 trivial한 Reasoning 능력을 보이는 현상이 발견되었습니다.#Review#Video Reasoning#Diffusion Models#Chain-of-Steps#Emergent Behaviors#Layer Specialization#Training-Free Ensemble2026년 3월 17일댓글 수 로딩 중
[논문리뷰] AgentProcessBench: Diagnosing Step-Level Process Quality in Tool-Using AgentsLLMs가 tool-using agent로 발전하면서 외부 환경과 상호작용하는 능력은 크게 향상되었지만, long-horizon 상호작용에서는 여전히 취약합니다.#Review#Large language models#Process reward models#Tool-using agents#Step-level evaluation#Agent trajectories#Benchmark2026년 3월 17일댓글 수 로딩 중
[논문리뷰] daVinci-Env: Open SWE Environment Synthesis at ScaleLarge Language Models (LLMs)의 발전은 자율적인 Software Engineering (SWE) agent 개발을 가속화하고 있지만, 이러한 agent를 효과적으로 훈련하기 위해서는 대규모의 실행 가능하며 검증 가능한 환경이 필수적입니다.#Review#SWE Agents#Environment Synthesis#Large Language Models#Dockerfile#SWE-Bench Verified#Data Scaling#Quality Curation2026년 3월 15일댓글 수 로딩 중
[논문리뷰] Visual-ERM: Reward Modeling for Visual EquivalenceVision-to-Code 작업은 AI 지원 프론트엔드 개발, 과학 논문 파싱, 지식 관리 및 시스템 통합과 같은 다양한 하위 시스템에 필수적인 핵심 기능입니다.#Review#Reward Modeling#Vision-to-Code#Reinforcement Learning#Multimodal Generative Model#Visual Equivalence#Fine-grained Feedback#Test-Time Scaling2026년 3월 15일댓글 수 로딩 중
[논문리뷰] Video Streaming Thinking: VideoLLMs Can Watch and Think Simultaneously온라인 Video Large Language Models (VideoLLMs) 는 스트리밍 시각 입력(streaming visual inputs)을 해석하고 실시간으로 응답하는 데 필수적이며, 특히 Embodied Intelligence와 상호작용형 AI 어시스턴트에서 중요하다.#Review#Streaming Video Understanding#VideoLLMs#Chain-of-Thought (CoT)#Real-time AI#Reinforcement Learning#Knowledge Graphs#Streaming Thinking#Low Latency2026년 3월 15일댓글 수 로딩 중
[논문리뷰] VQQA: An Agentic Approach for Video Evaluation and Quality Improvement비디오 생성 모델의 빠른 발전에도 불구하고, 복잡한 사용자 의도에 모델 Output을 맞추는 것은 여전히 큰 과제입니다.#Review2026년 3월 15일댓글 수 로딩 중
[논문리뷰] V-Bridge: Bridging Video Generative Priors to Versatile Few-shot Image Restoration기존 image restoration 방법론은 주로 task-specific modeling에 초점을 맞추어 각 degradation type별로 상당한 supervision(백만 개 이상의 샘플)을 요구했습니다. 이는 (a) Traditional Image Restoration `#Review2026년 3월 15일댓글 수 로딩 중
[논문리뷰] Think While Watching: Online Streaming Segment-Level Memory for Multi-Turn Video Reasoning in Multimodal Large Language ModelsMultimodal Large Language Models (MLLMs)는 Offline Video Understanding Task에서 뛰어난 성능을 보였지만, Live Broadcasting, Monitoring, Robotic Assistants와 같이 continuously arriving video stream에 대한 Online Multi-turn Interaction에서는 약점을 드러냅니다.#Review#Streaming Video Reasoning#Multi-Turn Interaction#Segment-Level Memory#Causal Mask#Positional Encoding#Dual KV Cache#Multimodal Large Language Models2026년 3월 15일댓글 수 로딩 중
[논문리뷰] Steve-Evolving: Open-World Embodied Self-Evolution via Fine-Grained Diagnosis and Dual-Track Knowledge Distillation본 연구는 오픈 월드 환경에서 Embodied Agent가 Long-Horizon Compound Task를 자율적으로 수행하는 데 있어 Single-Step Planning Quality보다는 상호작용 경험을 어떻게 체계화하고 진화시키는지가 핵심 병목(bottleneck)임을 지적합니다.#Review2026년 3월 15일댓글 수 로딩 중
[논문리뷰] Spend Less, Reason Better: Budget-Aware Value Tree Search for LLM Agents최근 Large Language Models (LLMs)의 신뢰성을 향상하기 위해 test-time scaling 이 보편화되었지만, 기존 접근 방식은 컴퓨팅 리소스를 무한하다고 가정하여 에이전트가 중복되거나 막다른 길(dead-end) 궤적에 token 및 tool budgets 을 소진하는 문제가 있습니다.#Review2026년 3월 15일댓글 수 로딩 중
[논문리뷰] SimRecon: SimReady Compositional Scene Reconstruction from Real Videos기존 3D scene reconstruction 방법론들은 대개 scene을 holistic 하게 표현하여 시각적 fidelity는 뛰어나지만, 완전한 object geometry와 명확한 object boundary가 부족하여 simulation 및 interaction에 부적합하다는 근본적인 한계점을 가집니다.#Review#Compositional 3D Scene Reconstruction#Simulation-Ready Scenes#Active Viewpoint Optimization (AVO)#Scene Graph Synthesizer (SGS)#Real-world Videos#Physical Plausibility2026년 3월 15일댓글 수 로딩 중
[논문리뷰] OmniForcing: Unleashing Real-time Joint Audio-Visual Generation최근 LTX-2 와 Veo 3 와 같은 Joint Audio-Visual Diffusion Model들은 탁월한 Generation Quality를 보여주지만, Bidirectional Attention Dependency로 인해 높은 Latency를 겪어 Real-time Application에 적용하기 어렵습니다.#Review#Streaming Audio-Visual Generation#Diffusion Distillation#Autoregressive Video Synthesis#Multi-modal AI2026년 3월 15일댓글 수 로딩 중
[논문리뷰] Multimodal OCR: Parse Anything from DocumentsLarge language model과 Multimodal model 시대에 문서 파싱은 Pretraining 및 Retrieval을 위한 핵심 Data engine이 되었습니다.#Review#Multimodal OCR#MOCR#Document Parsing#Structured Graphics#Image-to-SVG#Vision-Language Models#OCR Arena2026년 3월 15일댓글 수 로딩 중
[논문리뷰] MM-CondChain: A Programmatically Verified Benchmark for Visually Grounded Deep Compositional ReasoningMultimodal Large Language Models ( MLLM )은 GUI 탐색과 같은 복잡한 시각적 워크플로우를 처리하는 데 점점 더 많이 사용되고 있지만, 이러한 Deep Compositional Reasoning 능력에 대한 평가는 여전히 부족합니다.#Review#MLLM#Deep Compositional Reasoning#Programmatically Verified Benchmark#Hard Negatives#Control Flow#VPIR#Path F12026년 3월 15일댓글 수 로딩 중
[논문리뷰] LookaheadKV: Fast and Accurate KV Cache Eviction by Glimpsing into the Future without Generation최근 LLM의 Context Length가 급증하면서 KV Cache 의 크기가 입력 시퀀스 길이에 비례하여 선형적으로 증가하며, 이는 long-context task 에서 메모리 병목 현상을 야기하여 inference scalability에 큰 제약을 초래하고 있습니다.#Review#KV Cache Eviction#Long Context LLM#Attention Score Prediction#LoRA#Parameter-Efficient#Time-to-First-Token2026년 3월 15일댓글 수 로딩 중
[논문리뷰] LMEB: Long-horizon Memory Embedding BenchmarkMemory-augmented system (예: OpenClaw )에서 Memory embedding은 필수적이지만, 현재 Text embedding benchmark들은 그 평가가 미흡합니다.#Review#Memory Embeddings#Long-horizon Memory Retrieval#Text Embedding Benchmarks#Episodic Memory#Dialogue Memory#Semantic Memory#Procedural Memory#Zero-Shot Evaluation2026년 3월 15일댓글 수 로딩 중