[vllm] Blackwell을 위한 새로운 MLA 백엔드: TOKENSPEED_MLA 분석 (DeepSeek R1 최적화)Blackwell(SM100) 아키텍처에서 DeepSeek R1의 MLA 성능을 극대화하는 TOKENSPEED_MLA 백엔드 도입 및 분석.#vLLM#DeepSeek-R1#MLA#Blackwell#CUDA#Performance-Optimization2026년 5월 14일댓글 수 로딩 중
[vllm] vLLM, DeepSeek V4 모델의 저지연을 위한 RMSNorm과 라우터 GEMV 연산 융합으로 성능 극대화vLLM이 DeepSeek V4 모델에서 RMSNorm과 라우터 GEMV 연산을 융합하여 지연 시간을 단축하고 처리량을 향상시킨 방법을 분석합니다.#vLLM#DeepSeek V4#성능 최적화#CUDA 커널#LLM 추론2026년 5월 14일댓글 수 로딩 중
[논문리뷰] WriteSAE: Sparse Autoencoders for Recurrent State본 논문은 기존의 Residual SAE가 해결하지 못했던 state-space 및 hybrid recurrent language model의 matrix cache write 문제를 다룬다.#Review#Sparse Autoencoders#State-Space Models#Recurrent Neural Networks#Mechanistic Interpretability#Cache-Patching#WriteSAE2026년 5월 13일댓글 수 로딩 중
[논문리뷰] Vividh-ASR: A Complexity-Tiered Benchmark and Optimization Dynamics for Robust Indic Speech Recognition본 논문은 multilingual ASR 모델인 Whisper를 저자원(Low-resource) 언어로 fine-tuning 할 때 발생하는 성능 불균형 문제를 해결하는 데 집중한다.#Review#Speech Recognition#Curriculum Learning#Indic Languages#Fine-tuning#Whisper#Studio-bias#Robustness2026년 5월 13일댓글 수 로딩 중
[논문리뷰] Visual Aesthetic Benchmark: Can Frontier Models Judge Beauty?본 연구는 기존의 이미지 미학 평가 방식인 Scalar Score 예측이 인간의 실제 비교 선호도를 충실히 반영하지 못한다는 문제를 제기합니다. 기존 연구들은 독립적인 점수 매기기를 통해 순위를 도출하는데, 이는 annotator 간의 의견 불일치와 모호한 미적 기준을 야기합니다.#Review#Multimodal Large Language Models#Visual Aesthetic Benchmark#Comparative Ranking#Expert Consensus#Aesthetic Evaluation#Fine-tuning2026년 5월 13일댓글 수 로딩 중
[논문리뷰] TrackCraft3R: Repurposing Video Diffusion Transformers for Dense 3D Tracking본 논문은 기존의 영상 기반 3D 추적 방식이 가진 한계를 극복하고, 사전 학습된 비디오 생성 모델의 풍부한 시공간적 지식을 활용하여 효율적인 dense 3D tracking 프레임워크를 구축하는 것을 목표로 합니다.#Review#Video Diffusion Transformer#Dense 3D Tracking#Dual-Latent Representation#Temporal RoPE Alignment#Reference-Anchored Tracking2026년 5월 13일댓글 수 로딩 중
[논문리뷰] The Extrapolation Cliff in On-Policy Distillation of Near-Deterministic Structured Outputs본 논문은 LLM의 On-policy Distillation 과정에서 발생하는 reward extrapolation의 한계점을 해결하고자 한다.#Review#On-policy Distillation#Reward Extrapolation#Structured Output#Format Adherence#Importance Sampling#LLM2026년 5월 13일댓글 수 로딩 중
[논문리뷰] The DAWN of World-Action Interactive Models본 논문은 기존 World Action Models(WAMs)가 세계 예측과 행동 생성을 독립적인 병렬 구조나 고정된 predict-then-plan 파이프라인으로 처리함으로써, 주행 환경의 핵심인 '행동 의존적 미래(action-contingent future)'를 모델링하는 데 한계가 있음을 지적합니다.#Review#World-Action Interactive Models#Autonomous Driving#Latent Generative Model#Recursive Interaction#Trajectory Planning#Action-Contingent2026년 5월 13일댓글 수 로딩 중
[논문리뷰] ShapeCodeBench: A Renewable Benchmark for Perception-to-Program Reconstruction of Synthetic Shape Scenes본 논문은 현대의 멀티모달 모델들이 이미지를 코드로 변환하는 능력을 평가할 때 발생하는 벤치마크 오염과 고정된 데이터셋의 한계를 해결하기 위해 ShapeCodeBench를 제안합니다. 기존 연구들은 결정론적 실행이나 정밀한 난이도 제어가 부족하여 모델의 실패 원인을 명확히 진단하기 어렵다는 문제가 있었습니다.#Review#Perception-to-Program Reconstruction#Benchmark#Synthetic Data#Renewable Evaluation#Multimodal Models#DSL2026년 5월 13일댓글 수 로딩 중
[논문리뷰] SafeHarbor: Hierarchical Memory-Augmented Guardrail for LLM Agent Safety본 논문은 LLM 에이전트의 강력한 도구 사용 능력(tool-use)으로 인한 새로운 보안 위협과 기존 방어 기법들의 한계점을 해결하고자 합니다.#Review#LLM Agent Safety#Memory Mechanism#Guardrail#Adversarial Generation#Information Entropy#Over-refusal Mitigation2026년 5월 13일댓글 수 로딩 중
[논문리뷰] RoboEvolve: Co-Evolving Planner-Simulator for Robotic Manipulation with Limited Data본 논문은 로봇 조작(Robotic Manipulation) 분야에서 작업에 최적화된 물리적 상호작용 데이터가 부족하다는 근본적인 문제를 해결하고자 합니다.#Review#Robotic Manipulation#Vision-Language Models#Video Generation Models#Self-Evolving Framework#Complementary Learning Systems#Data Efficiency#Reinforcement Learning2026년 5월 13일댓글 수 로딩 중
[논문리뷰] Revisiting DAgger in the Era of LLM-Agents본 논문은 장기 상호작용을 수행하는 LLM 에이전트의 사후 학습(Post-training) 단계에서 발생하는 고질적인 분포 불일치 문제를 해결하고자 합니다.#Review#LLM-Agents#DAgger#Covariate Shift#Multi-Turn Interaction#Post-Training#Imitation Learning2026년 5월 13일댓글 수 로딩 중
[논문리뷰] Retrieval is Cheap, Show Me the Code: Executable Multi-Hop Reasoning for Retrieval-Augmented Generation본 논문은 기존의 Retrieval-Augmented Generation (RAG) 시스템이 다중 홉 질문 추론에서 보이는 근본적인 한계를 해결하고자 합니다.#Review#Retrieval-Augmented Generation#Multi-Hop Reasoning#Program Synthesis#Executable Planning#Compiler-Grounded Self-Repair#Adaptive Retrieval2026년 5월 13일댓글 수 로딩 중
[논문리뷰] Results and Retrospective Analysis of the CODS 2025 AssetOpsBench Challenge본 논문은 LLM 기반 에이전트가 복잡한 산업 환경에서 실질적인 능력을 발휘하는지 평가하기 위한 방법론적 문제를 다룹니다. 기존 벤치마크는 지나치게 단순화된 과제에 의존하거나, 실무에서 필수적인 프라이버시 보호 및 다단계 실행 능력을 적절히 측정하지 못하는 한계가 있습니다 .#Review#Agentic AI#Industry 4.0#Benchmarking#Privacy-preserving#Multi-agent systems#Performance Evaluation#AssetOpsBench2026년 5월 13일댓글 수 로딩 중
[논문리뷰] RealICU: Do LLM Agents Understand Long-Context ICU Data? A Benchmark Beyond Behavior Imitation본 논문은 기존의 ICU 벤치마크들이 임상 의사결정을 단순한 정적 문제로 치부하거나, 과거 임상 기록을 그대로 정답으로 간주하는 'Behavior Imitation' 오류에 빠져 있다는 점을 지적한다.#Review#LLM Agents#ICU#Clinical Decision Support#Hindsight-Annotated Benchmark#Structured Memory#Sequential Decision-Making2026년 5월 13일댓글 수 로딩 중
[논문리뷰] PresentAgent-2: Towards Generalist Multimodal Presentation Agents본 논문은 기존의 문서 기반 프레젠테이션 자동화 도구가 가지는 제약을 극복하고, 사용자의 오픈 엔드 쿼리로부터 직접적인 프레젠테이션 영상을 생성하는 시스템을 목표로 한다.#Review#Multimodal Agent#Presentation Generation#Deep Research#Interactive Delivery#Dynamic Media#Benchmark2026년 5월 13일댓글 수 로딩 중
[논문리뷰] Predicting Decisions of AI Agents from Limited Interaction through Text-Tabular Modeling본 논문은 미지의 AI 에이전트가 제한된 과거 상호작용만으로 타 에이전트의 다음 결정을 예측할 수 있는지에 대한 핵심 질문을 다룬다. 실제 경제 활동에서의 AI 에이전트 간 상호작용은 상업적 비밀 및 통제된 환경의 부재로 인해 체계적인 모델링이 어렵다.#Review#Agent Modeling#Text-Tabular Prediction#LLM-as-Observer#Few-shot Learning#Multi-agent Bargaining#Cross-population Transfer2026년 5월 13일댓글 수 로딩 중
[논문리뷰] PersonalAI 2.0: Enhancing knowledge graph traversal/retrieval with planning mechanism for Personalized LLM Agents본 논문은 기존 GraphRAG 시스템이 직면한 정적 온톨로지와 비효율적인 그래프 탐색 알고리즘의 한계를 극복하기 위해 PAI-2를 제안합니다. 기존의 모델들은 주로 노드 단위의 단순 검색에 의존하여 다중 홉(multi-hop) 추론 능력이 제한적이거나 도메인 적응성이 낮다는 문제를 가지고 있습니다.#Review#GraphRAG#Search Planning#Graph Traversal#Knowledge Graph#LLM Agents#Multi-hop Reasoning2026년 5월 13일댓글 수 로딩 중
[논문리뷰] MulTaBench: Benchmarking Multimodal Tabular Learning with Text and Image본 논문은 현대의 멀티모달 학습에서 기존 연구들이 정형 데이터와 비정형 데이터의 결합을 단순한 '동시 발생'으로만 취급하여 최적의 예측 성능을 내지 못하고 있다는 문제에서 출발한다 .#Review#Multimodal Tabular Learning#Tabular Foundation Models#Target-Aware Representations#MulTaBench#Joint Modeling#Benchmark Curation2026년 5월 13일댓글 수 로딩 중
[논문리뷰] MemReread: Enhancing Agentic Long-Context Reasoning via Memory-Guided Rereading본 논문은 기존 long-context reasoning 모델들이 겪는 '정보의 영구적 손실'과 '무분별한 검색으로 인한 노이즈 유입' 문제를 해결하기 위해 MemReread를 제안한다. 기존 retrieval 기반 에이전트는 검색 쿼리의 부정확성과 불필요한 검색으로 인해 핵심 신호가 희석되는 한계를 가진다 .#Review#Long-Context Reasoning#Agentic Memory#Rereading#Reinforcement Learning#GRPO#Information Retrieval#Contextual Inference2026년 5월 13일댓글 수 로딩 중