최신 포스트

[논문리뷰] Holistic Data Scheduler for LLM Pre-training via Multi-Objective Reinforcement Learning

본 논문은 LLM pre-training의 데이터 혼합 전략이 단일 최적화 관점에만 치중되어, 복잡하고 동적인 학습 과정을 충분히 반영하지 못하는 문제를 해결합니다.

#Review #Large Language Models #Deep Reinforcement Learning #Online Data Mixing #Reward Shaping #Multi-Objective Optimization #Curriculum Learning #Training Efficiency

2026년 6월 23일

[논문리뷰] FlowR2A: Learning Reward-to-Action Distribution for Multimodal Driving Planning

본 논문은 기존 자율주행 계획 연구의 양대 산맥인 Scoring-based 방식과 Anchor-based 방식 사이의 구조적 한계를 해결하고자 한다.

#Review #Multimodal Driving Planning #Flow-matching #Reward-conditioned Distribution #Autonomous Driving #Trajectory Generation #Classifier-Free Guidance

2026년 6월 23일

[논문리뷰] FedOT: Ownership Verification and Leakage Tracing via Watermarks for Federated LDMs

본 논문은 Federated Learning 환경에서 학습된 LDMs의 모델 소유권 보호와 유출 경로 추적 문제를 해결하기 위해 제안되었습니다 . 기존의 연구들은 주로 분류 모델에 집중되어 있어 복잡한 생성 모델인 LDMs에 직접 적용하기 어렵습니다.

#Review #Federated Learning #Latent Diffusion Models #Watermarking #Ownership Verification #Leakage Tracing #Latent Vector Transformation

2026년 6월 23일

[논문리뷰] FLUX3D: High-Fidelity 3D Gaussian Generation with Diffusion-Aligned Sparse Representation

본 논문은 기존 sparse voxel 기반 image-to-3DGS 생성 모델이 겪는 고해상도 외형 디테일의 손실 문제를 해결하고자 합니다.

#Review #3D Gaussian Splatting #Diffusion-Aligned Sparse Representation #Sparse-Structure-Aware Diffusion #Image-to-3D Generation #High-Fidelity Reconstruction #Cross-modal Alignment

2026년 6월 23일

[논문리뷰] FLAT: Feedforward Latent Triangle Splatting for Geometrically Accurate Scene Generation

본 논문은 기존의 Feedforward 장면 생성 모델들이 출력하는 볼륨 기반의 3D Gaussian 방식이 가지는 기하학적 한계를 극복하고자 합니다.

#Review #3D Scene Generation #Triangle Splatting #Video Diffusion Models #Differentiable Rendering #Feedforward Latent Decoding #Surface Reconstruction

2026년 6월 23일

[논문리뷰] EventVLA: Event-Driven Visual Evidence Memory for Long-Horizon Vision-Language-Action Policies

본 논문은 기존의 VLA 모델이 엄격한 Markovian 가정 하에 작동하여 장기 작업(long-horizon) 중 발생하는 시각 정보의 차단이나 일시적 변화를 적절히 처리하지 못하는 문제를 해결합니다.

#Review #Vision-Language-Action Models #Robotic Manipulation #Long-Horizon #Memory-Augmented #Keyframe Evidence Memory #Non-Markovian

2026년 6월 23일

[논문리뷰] Escaping the Self-Confirmation Trap: An Execute-Distill-Verify Paradigm for Agentic Experience Learning

본 연구는 LLM 기반 에이전트의 자가 진화(Self-evolution) 과정에서 발생하는 Self-Confirmation Trap 문제를 해결하고자 합니다.

#Review #LLM Agents #Experience Learning #Self-Confirmation Trap #Multi-Agent Collaboration #Memory Construction #Heterogeneous Execution

2026년 6월 23일

[논문리뷰] DiffusionBench: On Holistic Evaluation of Diffusion Transformers

본 논문은 현재 DiT 연구가 class-conditional ImageNet generation 성능에만 지나치게 편중되어, 실제 모델의 범용적인 성능 향상을 보장하지 못하는 문제를 해결하고자 합니다.

#Review #Diffusion Transformers #ImageNet #Text-to-Image #Benchmarking #Unified Framework #Generative Modeling

2026년 6월 23일

[논문리뷰] DREAM: Dense Retrieval Embeddings via Autoregressive Modeling

본 논문은 기존 Contrastive Learning 기반의 Dense Retriever 학습이 고비용의 레이블 데이터와 정교한 Hard Negative Mining을 필요로 하는 한계를 극복하고자 합니다.

#Review #Dense Retrieval #Autoregressive Modeling #Next-Token Prediction #Attention Heads #Frozen LLM #Information Retrieval

2026년 6월 23일

[논문리뷰] ChartWalker: Benchmarking the Cross-Chart RAG Task

본 논문은 기존의 Cross-Chart RAG 연구들이 가진 구조적 정보 부족과 논리적 추론 한계를 해결하고자 합니다.

#Review #Cross-Chart RAG #Knowledge Graph #Multimodal #Reasoning Paths #Benchmark #Agentic Retrieval

2026년 6월 23일

[논문리뷰] Are Text-to-Image Models Inductivist Turkeys? A Counterfactual Benchmark for Causal Reasoning

본 논문은 현재의 Text-to-Image (T2I) 모델들이 진정한 인과적 추론 능력을 갖추었는지, 아니면 단순한 패턴 매칭에 불과한지를 검증하는 문제를 해결하고자 한다.

#Review #Counterfactual Reasoning #Text-to-Image Generation #Causal Understanding #Benchmark #Prior Resistance #Vision-Language Model

2026년 6월 23일

[논문리뷰] An Efficient Method for the Optimal Control of Microgrids Under Uncertainties using Local Reduction

본 논문은 마이크로그리드 내의 신재생 에너지, 전력 수요, 가격 등 다양한 불확실성 환경에서 최적의 설비 규모 결정과 전력 스케줄링을 수행하는 문제를 다룹니다 .

#Review #Microgrids #Robust Optimal Control #Local Reduction #Energy Storage Systems #Mixed-Integer Linear Programming #Nonlinear Programming

2026년 6월 23일

[논문리뷰] AOHP: An Open-Source OS-Level Agent Harness for Personalized, Efficient and Secure Interaction

기존의 개인용 운영체제는 앱 중심(app-centric)으로 설계되어 있어, 자율적으로 도구를 호출하고 작업을 수행하는 AI 에이전트의 워크플로우를 지원하는 데 적합하지 않습니다. 기존 시스템의 고정된 GUI와 파편화된 앱 생태계는 에이전트의 상호작용에 있어 높은 실행 오버헤드와 보안상의 취약점을 야기합니다.

#Review #OS-level Agent #AOSP #Personalized Service Composition #Agent-Native OS #Information-Flow Security #Android

2026년 6월 23일

[논문리뷰] AGORA: An Archive-Grounded Benchmark for Agentic Workplace Document Reasoning

본 논문은 현대의 LLM 기반 에이전트가 기업 내부의 방대한 문서 아카이브에서 실질적인 지식 업무를 수행하는 데 필요한 Archive-grounded reasoning 능력을 평가하기 위해 Agora를 제안한다.

#Review #Agentic AI #Document Reasoning #Archive-Grounded #Benchmark #Multi-Hop QA #Workplace Automation

2026년 6월 23일

[sglang] [HunyuanVideo] Sequence Parallelism 최적화: Text Token Sharding으로 성능 한계 돌파하기

HunyuanVideo 모델에서 텍스트 토큰을 분산 처리하여 중복 연산을 제거하고 추론 속도를 최대 5.7% 향상시킨 기법을 분석합니다.

#SGLang #HunyuanVideo #Sequence Parallelism #DeepSpeed Ulysses #Distributed Computing

2026년 6월 20일

[vllm] vLLM Qwen3-VL 멀티 비디오 프롬프트 처리 최적화 분석

텍스트 기반 프롬프트 확장 방식을 토큰 수준 치환으로 변경하여 성능 향상 및 EVS 버그를 해결했습니다.

#vLLM #Qwen3-VL #Optimization #LLM #Multimodal

2026년 6월 20일

[axolotl] Axolotl, Marlin W4A16 도입으로 MoE 모델 추론 속도 1.79배 향상 및 품질 개선

Axolotl이 Marlin W4A16 백엔드를 도입하여 MoE 모델의 추론 속도를 1.79배 높이고, 활성화 양자화 오류를 제거하여 모델 품질을 향상시켰습니다.

#Axolotl #Marlin #MoE #DeepSeek-V4 #W4A16 #BF16 #Quantization #Optimization #Deep Learning #LLM

2026년 6월 20일

[sglang] SGLang: AMD GPU 환경에서의 DeepSeek-V4 성능 최적화 분석

AMD GPU 환경에서 MLA GEMM 및 RoPE 연산을 최적화하여 추론 성능을 최대 8.8% 향상시킨 사례 분석

#SGLang #AMD #DeepSeek-V4 #Triton #GEMM #RoPE

2026년 6월 20일

[sglang] SGLang LTX-2 최적화: LoRA 병합 오버헤드 제거를 통한 추론 성능 향상

LTX-2 모델의 stage-1 distilled LoRA를 베이스 모델에 사전 병합하여, 요청마다 발생하는 병합/해제 오버헤드를 제거했습니다.

#SGLang #LTX-2 #LoRA #Optimization #Inference

2026년 6월 19일

[sglang] LTX-2 모델 성능 최적화: NPU 및 GPU에서의 지연 시간 단축 분석

LTX-2 모델의 E2E 지연 시간을 NPU에서 27%, GPU에서 3% 단축한 코드 변경 분석.

#sglang #LTX-2 #성능 최적화 #NPU #GPU #RMSNorm #FlashAttention

2026년 6월 19일