최신 포스트

[triton] MultiCTA Membar에 Fence + Cluster Relaxed 자동 삽입

Triton의 MultiCTA 환경에서 cross-CTA mbarrier에 fence_mbarrier_init과 cluster arrive/wait를 자동 삽입하여 동기화 정합성을 보장하는 PR 분석.

#Triton #NVIDIA #MultiCTA #Membar #Fence #ClusterBarrier

2026년 3월 3일

[triton] AMD Software Warp Pipeline에서 크래시 수정

AMD GPU의 ConvertWarpPipeline pass에서 AsyncWaitOp을 barrier로 인식하지 못해 발생하던 크래시를 수정하고 barrier 정렬 로직을 개선한 PR 분석.

#Triton #AMD #WarpPipeline #AsyncWait #BugFix #SWP

2026년 3월 3일

[triton] AMD BlockPingpong 패스의 non-MFMA dot 크래시 수정

AMD BlockPingpong 최적화가 FMA 기반 dot 연산에 적용되어 발생하던 크래시를 안전한 타입 캐스팅으로 수정한 PR을 분석합니다.

#Triton #AMD #Bug Fix #Pingpong #MFMA

2026년 3월 3일

[faster-qwen3-tts] HF Space에 1000자 텍스트 제한 추가로 CUDA static cache overflow 방지

StaticCache의 max_seq_len=2048을 초과하는 입력을 차단하기 위해 텍스트와 오디오 크기 제한을 서버에 추가한다

#faster-qwen3-tts #TTS #Security #Input Validation

2026년 3월 3일

[triton] AMD GFX1250 MachineSink 이슈 우회를 위한 fence 추가

LLVM의 MachineSink 최적화가 LDS load를 barrier 너머로 이동시키는 버그를 우회하기 위해, AMD GFX1250 타겟에 compiler fence를 삽입한 PR을 분석합니다.

#Triton #AMD GPU #LLVM #Compiler Bug #Workaround

2026년 3월 3일

[논문리뷰] WorldStereo: Bridging Camera-Guided Video Generation and Scene Reconstruction via 3D Geometric Memories

본 논문은 카메라 안내 비디오 생성 모델(VDMs)이 일관된 3D 장면을 재구성하는 데 겪는 한계, 특히 제한적인 카메라 제어 및 여러 시점에서의 내용 불일치 문제를 해결하는 것을 목표로 합니다.

#Review #Video Generation #3D Reconstruction #Camera Control #Diffusion Models #Geometric Memory #Multi-View Consistency #World Model

2026년 3월 2일

[논문리뷰] When Does RL Help Medical VLMs? Disentangling Vision, SFT, and RL Gains

의료 Vision-Language Model (VLM)에서 강화 학습(RL)이 시각적 추론을 개선하는지, 또는 주로 Supervised Fine-tuning (SFT)을 통해 이미 유도된 행동을 단순히 강화하는지에 대한 불분명함을 해소하는 것이 목표입니다.

#Review #Medical VLMs #Reinforcement Learning #Supervised Fine-tuning #Visual Question Answering #Multi-modality #Reasoning Capacity #MedMNIST

2026년 3월 2일

[논문리뷰] VGGT-Det: Mining VGGT Internal Priors for Sensor-Geometry-Free Multi-View Indoor 3D Object Detection

본 연구는 정밀한 카메라 자세나 깊이 정보 와 같은 센서 기반의 기하학적 입력 없이 다중 시점 실내 3D 객체 탐지를 수행하는 Sensor-Geometry-Free (SG-Free) 설정을 목표로 합니다.

#Review #3D Object Detection #Multi-View #Sensor-Geometry-Free #Transformer #VGGT #Attention-Guided Query Generation #Query-Driven Feature Aggregation

2026년 3월 2일

[논문리뷰] Tool-R0: Self-Evolving LLM Agents for Tool-Learning from Zero Data

본 논문은 기존의 인간 감독 및 데이터셋 구축에 의존하는 LLM 도구 학습 의 확장성 문제를 해결하고자 합니다. 사전 데이터 없이 약한 LLM이 스스로 도구 사용 능력을 학습하여 범용 도구 호출 에이전트 로 발전할 수 있는 자기 진화 프레임워크 Tool-R0 을 제안합니다.

#Review #Large Language Models (LLMs)#Self-Play Reinforcement Learning (RL)#Tool-Learning #Zero-Data Learning #LLM Agents #Curriculum Learning #Reward Shaping #Co-evolution

2026년 3월 2일

[논문리뷰] Spectral Condition for μP under Width-Depth Scaling

본 논문은 폭(width)과 깊이(depth)가 동시에 확장되는 최신 생성형 파운데이션 모델에서 발생하는 불안정한 특징 학습 및 신뢰할 수 없는 하이퍼파라미터(HP) 전이 문제를 해결하고자 합니다.

#Review #μP #Width-Depth Scaling #Spectral Condition #Hyperparameter Transfer #Generative Foundation Models #Deep Residual Networks #Scale Invariance

2026년 3월 2일

[논문리뷰] SWE-rebench V2: Language-Agnostic SWE Task Collection at Scale

본 논문은 대규모의 재현 가능한 소프트웨어 엔지니어링(SWE) 태스크 환경 부족 문제를 해결하고, 특히 강화 학습(RL) 기반 LLM 에이전트 훈련을 위한 언어 독립적인(language-agnostic) SWE 태스크 컬렉션 을 대규모로 구축하는 것을 목표로 합니다.

#Review #SWE Agents #Reinforcement Learning #Task Collection #Language-Agnostic #Automated Pipeline #Docker #LLM Judges #Reproducibility

2026년 3월 2일

[논문리뷰] RubricBench: Aligning Model-Generated Rubrics with Human Standards

본 논문은 최신 대규모 언어 모델(LLM) 의 복잡한 생성물에 대한 평가에서 표면적인 편향 을 완화하고 인간의 의도를 정확히 반영하기 위해 루브릭 기반 평가 의 신뢰성을 평가하는 통일된 벤치마크가 부족하다는 문제를 해결합니다.

#Review #LLM Evaluation #Reward Models #Rubric-Guided Evaluation #Benchmarks #Model Alignment #Human Standards #Cognitive Misalignment

2026년 3월 2일

[논문리뷰] Recursive Think-Answer Process for LLMs and VLMs

현재 Think-Answer 모델 들은 단일 패스(single-pass) 추론에 의존하여 'Oops!'와 같은 불확실성 신호를 보여도 자체 수정을 수행하지 못하고 오류에 취약합니다.

#Review #LLMs #VLMs #Reasoning #Self-Correction #Reinforcement Learning #Confidence Estimation #Iterative Refinement #Think-Answer

2026년 3월 2일

[논문리뷰] Reasoning Core: A Scalable Procedural Data Generation Suite for Symbolic Pre-training and Post-Training

이 논문은 대규모 언어 모델(LLM)의 추론 능력 확장을 위해 기존 생성 방식의 분포적 다양성 부족 문제를 해결하고자 합니다.

#Review #Procedural Data Generation #Symbolic Reasoning #Language Model Pre-training #Reinforcement Learning with Verifiable Rewards #Formal Logic #PDDL Planning #Context-Free Grammars

2026년 3월 2일

[논문리뷰] OpenAutoNLU: Open Source AutoML Library for NLU

OpenAutoNLU는 텍스트 분류 및 NER(Named Entity Recognition)을 포함한 NLU(Natural Language Understanding) 태스크를 위한 오픈 소스 AutoML 라이브러리 를 개발하는 것을 목표로 합니다.

#Review #AutoML #Natural Language Understanding #Text Classification #Named Entity Recognition #Out-of-Distribution Detection #Few-Shot Learning #Data Quality #Low-Code API

2026년 3월 2일

[논문리뷰] OmniLottie: Generating Vector Animations via Parameterized Lottie Tokens

이 논문은 편집 용이성, 플랫폼 호환성, 해상도 독립성이 부족한 기존 래스터 비디오 애니메이션 생성 방식의 한계를 극복하고자 합니다.

#Review #Vector Animation Generation #Lottie #Multimodal Instructions #Tokenizer #Vision-Language Models #Generative AI #Dataset

2026년 3월 2일

[논문리뷰] MMR-Life: Piecing Together Real-life Scenes for Multimodal Multi-image Reasoning

본 논문은 실생활 시나리오에서 멀티모달 대규모 언어 모델(MLLM) 의 다양한 다중 이미지 추론 능력을 평가하기 위한 표준화된 벤치마크의 부재를 해결하는 것을 목표로 합니다.

#Review #Multimodal Reasoning #Multi-Image Analysis #Real-life Scenarios #Benchmark #MLLMs Evaluation #Chain-of-Thought #Reasoning Types

2026년 3월 2일

[논문리뷰] Legal RAG Bench: an end-to-end benchmark for legal RAG

법률 RAG 시스템의 종단 간(end-to-end) 성능을 평가하기 위한 고품질 벤치마크 및 평가 방법론이 부족하다는 문제점을 해결하고자 합니다.

#Review #Retrieval-Augmented Generation (RAG)#Legal AI #Benchmark #Evaluation Methodology #Embedding Models #Large Language Models (LLMs)#Error Decomposition #Information Retrieval

2026년 3월 2일

[논문리뷰] Learn Hard Problems During RL with Reference Guided Fine-tuning

이 논문은 수학적 추론을 위한 강화 학습(RL)에서 발생하는 보상 희소성(reward sparsity) 문제를 해결하는 것을 목표로 합니다. 특히, 대규모 언어 모델(LLM)이 어려운 문제에 대한 정확한 추론 궤적을 생성하지 못하여 유의미한 보상 신호를 받지 못하는 한계를 극복하고자 합니다.

#Review #Reinforcement Learning #Mathematical Reasoning #Reward Sparsity #Fine-tuning #Large Language Models #Reference-Guided Learning #DAPO

2026년 3월 2일

[논문리뷰] LaSER: Internalizing Explicit Reasoning into Latent Space for Dense Retrieval

본 논문은 강력한 추론 능력을 가진 LLM 기반 dense retriever 가 복잡한 쿼리에 대해 높은 지연 시간 없이 추론 능력을 활용하지 못하는 문제를 해결하고자 합니다.

#Review #Dense Retrieval #LLMs #Reasoning #Knowledge Distillation #Latent Space #Self-Distillation #Chain-of-Thought

2026년 3월 2일