[triton] getTranspositionSelectors 알고리즘 단순화 및 복원다중 mixed transposition에서의 정합성 문제를 해결하고, prmt selector 알고리즘의 수학적 분해를 명확히 정리한 사례를 분석합니다.#Triton#GPU#LinearLayout#Optimization#Algorithm2026년 3월 19일댓글 수 로딩 중
[triton] ConSan Multi-CTA 지원 추가Triton의 Concurrency Sanitizer(ConSan)에 multi-CTA 클러스터 환경 지원을 추가하여, 클러스터 내 여러 CTA가 공유하는 scratch memory 상태를 올바르게 추적하도록 개선한 PR을 분석합니다.#Triton#GPU Compiler#Concurrency Sanitizer#Multi-CTA#CUDA2026년 3월 19일댓글 수 로딩 중
[axolotl] Axolotl: Triton 커널을 활용한 Entropy 및 Selective Log Softmax 최적화Axolotl에서 Triton 커널을 사용하여 Entropy 및 Selective Log Softmax 계산을 최적화하여 훈련 성능을 크게 향상시킨 PR 분석.#Triton#PyTorch#Optimization#Deep Learning#Performance#GPU2026년 3월 19일댓글 수 로딩 중
[axolotl] Triton LoRA 커널 Autotune 테스트 안정화: pytest-xdist 환경에서의 모듈 격리 전략pytest-xdist 병렬 실행 시 sys.modules 공유로 인한 flaky 테스트를 _find_lora_ops_module 직접 패치 방식으로 해결한 사례를 분석합니다.#Axolotl#Triton#Testing#pytest#LoRA2026년 3월 19일댓글 수 로딩 중
[axolotl] Axolotl 커스텀 Triton 커널 — entropy/softmax 최대 5배 가속Triton 커널로 entropy_from_logits와 selective_log_softmax를 fuse하여 RLHF 학습을 가속한다#Triton#RLHF#Kernel Optimization#Axolotl2026년 3월 19일댓글 수 로딩 중
[Ray] find_gcs_addresses 결과 캐싱으로 프로세스 스캔 비용 제거매번 프로세스 목록을 스캔하던 GCS 주소 탐색을 캐싱하여 성능 개선#Ray#Performance2026년 3월 18일댓글 수 로딩 중
[Loki] Shard Factor 1일 때 Shuffle Shard 생략으로 메모리 50% 절감단일 파티션 할당 시 불필요한 ShuffleShard 호출을 건너뛰어 CPU와 메모리 사용량 대폭 절감.#Grafana Loki#Go#Performance#Memory Optimization#Kafka2026년 3월 18일댓글 수 로딩 중
[논문리뷰] When AI Navigates the Fog of War기존 Large Language Models (LLMs)의 geopolitical forecasting 연구들은 data leakage 문제로 인해 true out-of-distribution reasoning 능력을 정확히 평가하기 어렵다는 한계가 있었습니다.#Review2026년 3월 18일댓글 수 로딩 중
[논문리뷰] VideoAtlas: Navigating Long-Form Video in Logarithmic Compute장편 비디오(long-form video)를 이해하는 것은 방대한 시간적 공간 내에서 희소하고 태스크 관련 증거(task-relevant evidence)를 찾아내는 어려운 문제입니다. 기존의 비디오-언어 모델(VLM) 접근 방식은 두 가지 주요 도전 과제에 직면합니다.#Review2026년 3월 18일댓글 수 로딩 중
[논문리뷰] Video-CoE: Reinforcing Video Event Prediction via Chain of Events비디오 태스크에 대한 MLLM 애플리케이션의 발전에도 불구하고, VEP 는 상대적으로 미개척 상태로 남아있습니다.#Review#Video Event Prediction (VEP)#Multimodal Large Language Models (MLLMs)#Chain of Events (CoE)#Logical Reasoning#Visual Grounding#Reinforcement Learning (RL)#Supervised Fine-Tuning (SFT)2026년 3월 18일댓글 수 로딩 중
[논문리뷰] Unified Spatio-Temporal Token Scoring for Efficient Video VLMsVideo VLM은 방대한 수의 프레임을 인코딩하고, 각 프레임이 Vision Transformer (ViT)에 의해 수백 개의 Patch Token으로 분해되면서 막대한 계산 비용을 발생시킵니다.#Review#Token Pruning#Video-Language Models (VLMs)#Computational Efficiency#Spatio-Temporal Scoring#Vision Transformers (ViT)#Large Language Models (LLM)#End-to-End Training2026년 3월 18일댓글 수 로딩 중
[논문리뷰] Temporal Gains, Spatial Costs: Revisiting Video Fine-Tuning in Multimodal Large Language Models최근 MLLMs 는 비디오-기반 Supervised Fine-tuning (Video-SFT) 을 통해 시각적 이해 능력을 크게 발전시켜왔습니다. 그러나 Video-SFT 가 시각적 능력의 미세한 진화, 특히 공간적 이해와 시간적 이해 사이의 균형에 미치는 영향은 아직 제대로 연구되지 않았습니다.#Review#Multimodal Large Language Models (MLLMs)#Video-SFT#Temporal Trap#Spatial Understanding#Temporal Budget#Hybrid-Frame Strategy#Negative Transfer2026년 3월 18일댓글 수 로딩 중
[논문리뷰] Stereo World Model: Camera-Guided Stereo Video Generation기존의 generative world model은 주로 monocular video representation을 사용하며, 이는 implicit depth, ambiguous scale, 그리고 long-horizon camera trajectory에서 누적되는 3D error와 같은 근본적인 기하학적 한계를 가집니다.#Review2026년 3월 18일댓글 수 로딩 중
[논문리뷰] RAMP: Reinforcement Adaptive Mixed Precision Quantization for Efficient On Device LLM Inference최근 Large Language Models (LLMs)는 자연어 처리 분야를 혁신했지만, FP16 포맷의 Llama-2-13B 모델이 26GB 의 memory를 요구하는 등 막대한 memory requirement로 인해 consumer GPU나 edge device에 배포하는 데 어려움을 겪는 Memory Wall 문제가 존재합니다.#Review#Mixed-Precision Quantization#Reinforcement Learning#Post-Training Quantization#Large Language Models#Policy Transfer#Scale Folding#GGUF#On-Device Inference2026년 3월 18일댓글 수 로딩 중
[논문리뷰] MosaicMem: Hybrid Spatial Memory for Controllable Video World Models비디오 diffusion 모델은 단순한 plausible clip 생성에서 카메라 모션, revisits, 그리고 intervention 하에서 일관성을 유지하는 world simulator로 발전하고 있습니다.#Review#Spatial Memory#World Models#Video Diffusion Models#Hybrid Memory#Controllable Video Generation#Long-horizon Consistency#Patch-and-Compose2026년 3월 18일댓글 수 로딩 중
[논문리뷰] MetaClaw: Just Talk -- An Agent That Meta-Learns and Evolves in the WildLarge language model (LLM) agent 는 복잡한 multi-step task 에서 강력한 성능을 보여왔지만, 실제 배포 환경에서 사용되는 agent 는 한 번 훈련되면 user 의 요구사항 변화에 관계없이 고정된 상태로 제공됩니다.#Review#LLM agents#continual learning#meta-learning#skill-driven adaptation#policy optimization#reinforcement learning#online adaptation2026년 3월 18일댓글 수 로딩 중
[논문리뷰] Look Before Acting: Enhancing Vision Foundation Representations for Vision-Language-Action ModelsVision-Language-Action (VLA) 모델은 로봇 조작에서 유망한 Paradigm으로 부상했지만, 신뢰할 수 있는 Action Prediction은 시각적 관찰과 언어 지침을 정확하게 해석하고 통합하는 데 크게 의존합니다.#Review2026년 3월 18일댓글 수 로딩 중
[논문리뷰] LoST: Level of Semantics Tokenization for 3D Shapes최근 autoregressive (AR) 모델이 3D generation의 강력한 패러다임으로 부상하고 있지만, 3D shape에 대한 최적의 tokenization 방법은 여전히 미해결 과제입니다.#Review#3D Shape Tokenization#Semantic Salience#Autoregressive Generation#Relational Inter-Distance Alignment#Diffusion Models#Triplane2026년 3월 18일댓글 수 로딩 중
[논문리뷰] LaDe: Unified Multi-Layered Graphic Media Generation and Decomposition기존 generative models , 특히 Diffusion Models (DM) 은 고품질 이미지를 생성하는 데 탁월하지만, 결과물을 단일 flat image artifact 로 생성하여 전문 디자인 워크플로우에서 요구되는 개별 요소에 대한 fine-grained control 을 제공하지 못하는 한계가 있습니다.#Review2026년 3월 18일댓글 수 로딩 중
[논문리뷰] GigaWorld-Policy: An Efficient Action-Centered World--Action Model기존 Vision-Language-Action (VLA) 모델 은 강력한 성능을 보였지만, 슈퍼비전 희소성(sparsity) 이라는 주요 문제에 직면해 있습니다.#Review2026년 3월 18일댓글 수 로딩 중