#Diffusion LLMs

10개의 포스트

[논문리뷰] S2D2: Fast Decoding for Diffusion LLMs via Training-Free Self-Speculation

arXiv에 게시된 'S2D2: Fast Decoding for Diffusion LLMs via Training-Free Self-Speculation' 논문에 대한 자세한 리뷰입니다.

#Review #Diffusion LLMs #Self-Speculation #Training-Free #Block-Diffusion #Fast Decoding #Rejection Sampling #Routing Policies

2026년 3월 26일

[논문리뷰] Skip to the Good Part: Representation Structure & Inference-Time Layer Skipping in Diffusion vs. Autoregressive LLMs

arXiv에 게시된 'Skip to the Good Part: Representation Structure & Inference-Time Layer Skipping in Diffusion vs. Autoregressive LLMs' 논문에 대한 자세한 리뷰입니다.

#Review #Diffusion LLMs #Autoregressive LLMs #Representational Analysis #Layer Skipping #Inference Efficiency #Initialization Bias #FLOPs Reduction #Recency Bias

2026년 3월 9일

[논문리뷰] Attention Is All You Need for KV Cache in Diffusion LLMs

arXiv에 게시된 'Attention Is All You Need for KV Cache in Diffusion LLMs' 논문에 대한 자세한 리뷰입니다.

#Review #Diffusion LLMs #KV Cache #Adaptive Caching #Inference Optimization #Attention Mechanism #Latency Reduction #Generative AI

2025년 10월 17일

[논문리뷰] ParallelBench: Understanding the Trade-offs of Parallel Decoding in Diffusion LLMs

arXiv에 게시된 'ParallelBench: Understanding the Trade-offs of Parallel Decoding in Diffusion LLMs' 논문에 대한 자세한 리뷰입니다.

#Review #Diffusion LLMs #Parallel Decoding #Speed-Quality Trade-off #Benchmark #Token Dependencies #Unmasking Strategies #Information Theory

2025년 10월 16일

[논문리뷰] Fast-dLLM v2: Efficient Block-Diffusion LLM

arXiv에 게시된 'Fast-dLLM v2: Efficient Block-Diffusion LLM' 논문에 대한 자세한 리뷰입니다.

#Review #Diffusion LLMs #Inference Acceleration #Parallel Decoding #Autoregressive Models #Caching #Fine-tuning #Block-wise Attention

2025년 10월 8일

[논문리뷰] DiffTester: Accelerating Unit Test Generation for Diffusion LLMs via Repetitive Pattern

Jia Li이 arXiv에 게시한 'DiffTester: Accelerating Unit Test Generation for Diffusion LLMs via Repetitive Pattern' 논문에 대한 자세한 리뷰입니다.

#Review #Diffusion LLMs #Unit Test Generation #Acceleration #Repetitive Patterns #Abstract Syntax Tree #Software Testing #Code Generation

2025년 10월 6일

[논문리뷰] Inpainting-Guided Policy Optimization for Diffusion Large Language Models

Chenyu Wang이 arXiv에 게시한 'Inpainting-Guided Policy Optimization for Diffusion Large Language Models' 논문에 대한 자세한 리뷰입니다.

#Review #Diffusion LLMs #Reinforcement Learning #Inpainting #Policy Optimization #Exploration #Mathematical Reasoning #GRPO

2025년 9월 15일

[논문리뷰] Quantization Meets dLLMs: A Systematic Study of Post-training Quantization for Diffusion LLMs

Haobo Xu이 arXiv에 게시한 'Quantization Meets dLLMs: A Systematic Study of Post-training Quantization for Diffusion LLMs' 논문에 대한 자세한 리뷰입니다.

#Review #Diffusion LLMs #Post-training Quantization (PTQ)#Model Compression #Activation Outliers #Quantization Methods #Efficient Deployment #Large Language Models

2025년 8월 21일

[논문리뷰] Speed Always Wins: A Survey on Efficient Architectures for Large Language Models

Jusen Du이 arXiv에 게시한 'Speed Always Wins: A Survey on Efficient Architectures for Large Language Models' 논문에 대한 자세한 리뷰입니다.

#Review #Large Language Models #Efficient Architectures #Transformer Optimization #Linear Attention #State Space Models #Mixture-of-Experts #Sparse Attention #Diffusion LLMs

2025년 8월 19일

[논문리뷰] Diffusion LLMs Can Do Faster-Than-AR Inference via Discrete Diffusion Forcing

Hao Zhang이 arXiv에 게시한 'Diffusion LLMs Can Do Faster-Than-AR Inference via Discrete Diffusion Forcing' 논문에 대한 자세한 리뷰입니다.

#Review #Diffusion LLMs #Faster Inference #Discrete Diffusion Forcing (D2F)#Autoregressive Generation #KV Cache Optimization #Parallel Decoding #Text Generation #Model Distillation

2025년 8월 14일