#Fused Operations

2개의 포스트

[ollama] Ollama MLX Gemma4 성능 최적화: Fused Operations를 통한 효율성 증대

Ollama의 MLX 백엔드에서 Gemma4 모델의 성능을 fused operations로 최적화한 PR 분석.

#Ollama #MLX #Gemma4 #성능 최적화 #Fused Operations #Deep Learning #Go #Machine Learning

2026년 4월 15일

[SGLang] Activation Functions: SiLU, GELU 커스텀 구현

SGLang의 활성화 함수 구현을 분석한다. SiLU, GELU, SiLU-and-Mul 등 Fused 활성화 함수의 커스텀 구현, PyTorch 기본 대비 성능 향상을 코드와 함께 살펴본다.

#sglang #Activation #SiLU #GELU #Fused Operations

2026년 4월 14일