[논문리뷰] Chiaroscuro Attention: Spending Compute in the Dark본 연구는 표준 Transformer가 모든 토큰에 대해 일관되게 고비용의 O(n²d) self-attention을 적용하는 비효율성을 해결하고자 합니다.#Review#CHIAR-Former#Spectral Entropy#DCT(Discrete Cosine Transform)#Routing Collapse#Operator Routing#Transformer Efficiency2026년 6월 8일댓글 수 로딩 중