본문으로 건너뛰기

#Model Compression

16개의 포스트

[논문리뷰] GoClick: Lightweight Element Grounding Model for Autonomous GUI Interaction

댓글 수 로딩 중

[논문리뷰] MASQuant: Modality-Aware Smoothing Quantization for Multimodal Large Language Models

댓글 수 로딩 중

[논문리뷰] ROCKET: Rapid Optimization via Calibration-guided Knapsack Enhanced Truncation for Efficient Model Compression

댓글 수 로딩 중

[논문리뷰] Black-Box On-Policy Distillation of Large Language Models

댓글 수 로딩 중

[논문리뷰] The Strong Lottery Ticket Hypothesis for Multi-Head Attention Mechanisms

댓글 수 로딩 중

[논문리뷰] Quantized Visual Geometry Grounded Transformer

댓글 수 로딩 중

[논문리뷰] GAPrune: Gradient-Alignment Pruning for Domain-Aware Embeddings

댓글 수 로딩 중

[논문리뷰] NVIDIA Nemotron Nano 2: An Accurate and Efficient Hybrid Mamba-Transformer Reasoning Model

댓글 수 로딩 중

[논문리뷰] A Survey on Diffusion Language Models

댓글 수 로딩 중

[논문리뷰] OBS-Diff: Accurate Pruning For Diffusion Models in One-Shot

댓글 수 로딩 중