본문으로 건너뛰기

#Quantization

61개의 포스트

[논문리뷰] OSP-Next: Efficient High-Quality Video Generation with Sparse Sequence Parallelism, HiF8 Quantization, and Reinforcement Learning

댓글 수 로딩 중

[논문리뷰] Measuring Maximum Activations in Open Large Language Models

댓글 수 로딩 중

[논문리뷰] SageBwd: A Trainable Low-bit Attention

댓글 수 로딩 중

[논문리뷰] MASQuant: Modality-Aware Smoothing Quantization for Multimodal Large Language Models

댓글 수 로딩 중

[논문리뷰] Baichuan-M3: Modeling Clinical Inquiry for Reliable Medical Decision-Making

댓글 수 로딩 중

[논문리뷰] TurboDiffusion: Accelerating Video Diffusion Models by 100-200 Times

댓글 수 로딩 중

[논문리뷰] INT v.s. FP: A Comprehensive Study of Fine-Grained Low-bit Quantization Formats

댓글 수 로딩 중

[논문리뷰] Quantized Visual Geometry Grounded Transformer

댓글 수 로딩 중

[논문리뷰] Semantic IDs for Joint Generative Search and Recommendation

댓글 수 로딩 중

[논문리뷰] Performance Trade-offs of Optimizing Small Language Models for E-Commerce

댓글 수 로딩 중