[llm-compressor] Compression Save: compressed-tensors 체크포인트 저장transformers/compression 디렉토리가 압축된 모델을 compressed-tensors 포맷으로 직렬화해 vLLM/SGLang이 로딩 가능하도록 만드는 구조 분석#llm-compressor#Compression#Save#compressed-tensors2026년 4월 13일댓글 수 로딩 중
[논문리뷰] TriAttention: Efficient Long Reasoning with Trigonometric KV CompressionarXiv에 게시된 'TriAttention: Efficient Long Reasoning with Trigonometric KV Compression' 논문에 대한 자세한 리뷰입니다.#Review#KV Cache#LLM#Attention#RoPE#Compression#Reasoning2026년 4월 6일댓글 수 로딩 중
[논문리뷰] Planning in 8 Tokens: A Compact Discrete Tokenizer for Latent World ModelSuha Kwak이 arXiv에 게시한 'Planning in 8 Tokens: A Compact Discrete Tokenizer for Latent World Model' 논문에 대한 자세한 리뷰입니다.#Review#World Model#Discrete Tokenizer#Latent Representation#Action Planning#Model Predictive Control#Real-time AI#Compression#Vision Foundation Model2026년 3월 8일댓글 수 로딩 중