최신 포스트

[논문리뷰] Mask-to-Height: A YOLOv11-Based Architecture for Joint Building Instance Segmentation and Height Classification from Satellite Imagery

도시 계획, 3D 도시 모델링 및 인프라 모니터링에 필수적인 건물 인스턴스 분할 및 높이 분류의 정확도를 높이는 것을 목표로 합니다. 특히, 연속적인 높이 회귀 대신 이산적인 높이 분류 를 통해 실제 도시 계획 요구사항에 더 잘 부합하고 노이즈에 강한 통합 프레임워크를 제시합니다.

#Review #Building Instance Segmentation #Height Classification #YOLOv11 #Satellite Imagery #Multitask Learning #Remote Sensing #Urban Planning

2025년 11월 9일

[논문리뷰] Limits of Generalization in RLVR: Two Case Studies in Mathematical Reasoning

본 연구는 RLVR (Reinforcement Learning with Verifiable Rewards) 이 LLM (Large Language Models) 의 수학적 추론 능력을 진정으로 향상시키는지, 아니면 피상적인 휴리스틱을 강화하는지에 대한 의문을 해결하고자 합니다.

#Review #Reinforcement Learning with Verifiable Rewards (RLVR)#Mathematical Reasoning #Large Language Models (LLMs)#Activity Scheduling #Longest Increasing Subsequence (LIS)#Generalization Limits #Reward Design #Self-consistency

2025년 11월 9일

[논문리뷰] INT v.s. FP: A Comprehensive Study of Fine-Grained Low-bit Quantization Formats

현대 AI 하드웨어는 LLM의 아웃라이어를 처리하기 위해 저정밀 부동소수점(FP) 형식을 점차 채택하고 있으나, 다양한 과립도(granularity)에 걸친 FP와 정수(INT) 양자화에 대한 통합적인 비교 연구가 부족합니다.

#Review #Quantization #Low-bit Formats #Integer Quantization #Floating-Point Quantization #Large Language Models (LLMs)#Hardware Efficiency #Fine-Grained Quantization #MXINT8

2025년 11월 9일

[논문리뷰] HyperClick: Advancing Reliable GUI Grounding via Uncertainty Calibration

본 논문은 자율 GUI(Graphical User Interface) 에이전트 가 부정확하거나 과도한 확신을 가진 예측을 생성하여 태스크 실패로 이어지는 문제를 해결하고자 합니다.

#Review #GUI Grounding #Uncertainty Calibration #Reinforcement Learning #Confidence Estimation #Brier Score #GUI Agents #Visual-Language Models

2025년 11월 9일

[논문리뷰] Higher-order Linear Attention

논문은 scaled dot-product attention의 이차 비용 문제를 해결하여 장문맥 언어 모델의 확장을 가능하게 하는 것을 목표로 합니다.

#Review #Linear Attention #Higher-order Interactions #Causal Streaming #Associative Scans #Prefix Summaries #Transformer Architectures #State Space Models

2025년 11월 9일

[논문리뷰] Dual-Stream Diffusion for World-Model Augmented Vision-Language-Action Model

본 논문은 세계 모델이 증강된 Vision-Language-Action (VLA) 모델에서 차세대 관측 및 액션 시퀀스를 공동으로 예측하는 데 내재된 모달리티 충돌 문제를 해결하고자 합니다.

#Review #Vision-Language-Action Models #World Models #Diffusion Models #Multimodal Learning #Robotics #Asynchronous Sampling #Diffusion Transformers

2025년 11월 9일

[논문리뷰] Defeating the Training-Inference Mismatch via FP16

대규모 언어 모델(LLM)의 강화 학습(RL) 미세 조정 과정에서 발생하는 불안정성의 근본 원인인 훈련-추론 불일치(training-inference mismatch) 를 해결하는 것이 목표입니다.

#Review #Reinforcement Learning #LLM Fine-tuning #Training-Inference Mismatch #Floating Point Precision #FP16 #BF16 #RL Stability

2025년 11월 9일

[논문리뷰] Continuous Autoregressive Language Models

Large Language Models (LLMs)의 비효율적인 순차적, 토큰 단위 생성 과정의 근본적인 한계를 극복하는 것이 목표입니다. 본 연구는 이산 토큰 예측에서 연속 벡터 예측 으로 패러다임을 전환하여, 각 생성 단계의 의미론적 대역폭을 증가 시킴으로써 LLM의 스케일링 및 계산 효율성을 향상시키고자 합니다.

#Review #Large Language Models (LLMs)#Continuous Representation #Autoencoder #Likelihood-Free Modeling #Energy-Based Models #Next-Vector Prediction #Computational Efficiency #Temperature Sampling

2025년 11월 9일

[논문리뷰] Beyond Objects: Contextual Synthetic Data Generation for Fine-Grained Classification

텍스트-이미지(T2I) 모델을 활용한 합성 데이터 생성 에서 발생하는 과적합 및 다양성 감소 문제를 해결하고, 특히 소량 데이터(few-shot) 환경에서 미세 조정 분류(fine-grained classification) 성능을 극대화하는 것을 목표로 합니다.

#Review #Text-to-Image Synthesis #Synthetic Data Generation #Fine-Grained Classification #Few-Shot Learning #Diffusion Models #Contextual Conditioning #Causal Intervention

2025년 11월 9일

[논문리뷰] A Survey on Efficient Vision-Language-Action Models

이 논문은 대규모 Vision-Language-Action (VLA) 모델 이 직면한 막대한 계산 및 데이터 요구사항으로 인해 실제 로봇 환경에 배포되기 어려운 문제를 해결하는 것을 목표로 합니다.

#Review #Embodied AI #Robotic Manipulation #VLA Models #Efficient AI #Model Compression #Efficient Training #Data Collection #Multimodal AI

2025년 11월 9일

[Triton] Proton 기본 버퍼 크기 설명 개선 — 문서화와 코드 주석 보강

Proton 프로파일러의 기본 버퍼 크기 설정에 대한 문서와 코드 주석을 명확하게 개선한다

#Triton #Proton #Documentation #Profiling #Developer Experience

2025년 11월 8일

[triton] Triton PROTON: FinalizeOp 최적화를 통한 프로파일링 오버헤드 개선

Triton PROTON의 FinalizeOp를 리팩토링하여 warp 단위 병렬 쓰기를 구현하고 프로파일링 오버헤드를 최대 2배 이상 개선했습니다.

#Triton #GPU #Optimization #Compiler #Profiling

2025년 11월 7일

[triton] AMD/Gluon: gfx1250에서 async_copy 런타임 테스트 추가 및 UpdateAsyncWaitCnt 활성화

AMD gfx1250 아키텍처에서 async_copy의 다양한 shared memory layout 조합에 대한 런타임 테스트를 추가하고 UpdateAsyncWaitCnt를 활성화한 분석.

#Triton #AMD #Gluon #gfx1250 #Async Copy #Testing

2025년 11월 6일

[Triton] Gluon에서 2CTA 모드 초기 지원

2025년 11월 7일

[Triton] AMD ds_read_tr의 b8/b16 타입 lowering 리워크

2025년 11월 7일

[triton] Triton에서의 MXFP 변환 성능 최적화: TMA와 벡터화된 연산 활용

Triton의 MXFP8/MXFP4 변환 커널을 TMA와 벡터화된 스토어, 타일링 튜닝을 통해 대폭 가속화한 사례를 분석합니다.

#Triton #MXFP #GPU #Optimization #HPC

2025년 11월 6일

[triton] Proton 커널 내 프로파일러 Global Memory 지원

Triton Proton의 intra-kernel profiler에 global memory buffer 지원을 추가하여, shared memory가 부족한 환경에서도 프로파일링이 가능하도록 한 PR을 분석합니다.

#Triton #Proton #Profiler #Global Memory #GPU Performance

2025년 11월 5일

[pydantic-ai] Validation 에러 재시도 메시지 개선 — Markdown 코드 블록 포맷

LLM에게 전달하는 validation 에러 메시지를 Markdown 코드 블록으로 포맷하여 가독성 향상

#Python #Pydantic AI #LLM #UX #Bug Fix

2025년 11월 4일

[vllm] ROCm AITER MHA 백엔드 재설계

AMD GPU용 AITER MHA 어텐션 백엔드를 재설계하여 cache 레이아웃 변환과 컨텍스트 병렬 처리를 개선

#vllm #Performance

2025년 11월 4일

[triton] Tutorials: 벤치마크 결과 테이블에 단위(units) 표시 추가

Triton 튜토리얼의 벤치마크 결과 테이블 컬럼에 ylabel 단위를 포함시켜 결과의 가독성을 개선한 변경 분석.

#Triton #Tutorial #Benchmark #UX #Python

2025년 11월 4일