최신 포스트

[논문리뷰] ClinAlign: Scaling Healthcare Alignment from Clinician Preference

대규모 언어 모델(LLM)을 의료 분야에서 의사의 세밀한 선호도 및 전문 표준에 맞춰 정렬하는 문제를 해결하는 것이 목표입니다. 기존 방법론의 일반적인 목표와 신뢰할 수 없는 자동 평가자의 한계를 극복하고, 확장 가능한 방식으로 임상 정렬(clinical alignment)을 달성하고자 합니다.

#Review #Healthcare AI #LLM Alignment #Clinician Preference #Rubric-based RLHF #Medical LLMs #Data Curation #HealthBench #Principle-based Supervision

2026년 2월 17일

[논문리뷰] Causal-JEPA: Learning World Models through Object-Level Latent Interventions

기존 객체 중심(object-centric) 월드 모델이 상호작용 의존적 다이내믹스를 포착하지 못하고 자가 다이내믹스나 우발적 상관관계에 의존하는 한계를 해결하고자 합니다.

#Review #World Models #Object-Centric Representations #Latent Interventions #Masked Prediction #Causal Inductive Bias #Joint Embedding Predictive Architecture (JEPA)#Visual Question Answering (VQA)#Model Predictive Control (MPC)

2026년 2월 17일

[논문리뷰] COMPOT: Calibration-Optimized Matrix Procrustes Orthogonalization for Transformers Compression

본 논문은 Transformer 모델의 사후 학습 압축에서 발생하는 정확도 저하 문제를 해결하고자 합니다.

#Review #Transformer Compression #Matrix Factorization #Sparse Dictionary Learning #Post-Training Quantization #Procrustes Analysis #Orthogonal Dictionary #Dynamic Allocation

2026년 2월 17일

[Triton] GFX1250 tensordesc index 수정

2026년 2월 18일

[pydantic-ai] Depot 러너와 inline_snapshot 우회로 CI 성능 대폭 개선

Depot 4코어 러너 도입과 inline_snapshot 경량 스텁으로 pytest-xdist 워커 초기화를 크게 가속화한 사례를 분석합니다.

#pydantic-ai #CI/CD #Performance #GitHub Actions #Testing

2026년 2월 17일

[faster-qwen3-tts] CUDA Graphs 기반 Qwen3-TTS 래퍼를 설치 가능한 Python 패키지로 구조화

Qwen3-TTS CUDA Graphs 최적화 코드를 pip 설치 가능한 Python 패키지로 재구성하고, 스트리밍 생성 API와 벤치마크 스위트를 추가한 사례를 분석합니다.

#Qwen3-TTS #CUDA Graphs #Python Package #TTS #Streaming #PyTorch

2026년 2월 17일

[triton] AMD 백엔드에서 Floating-Point Sanitizer(FPSan) 지원 활성화

AMD GPU(CDNA3/CDNA4/GFX1250)에서 FPSan을 지원하도록 테스트를 확장하고, warp size 차이에 따른 레이아웃 문제를 해결한 사례를 분석합니다.

#Triton #AMD #GPU #FPSan #Testing

2026년 2월 17일

[pydantic-ai] 로컬 테스트 성능 개선: coverage 분리와 fixture 최적화

make test에서 coverage를 분리하고 module-scope fixture로 모델 로딩 횟수를 줄여 로컬 개발 테스트 속도를 개선한 사례를 분석합니다.

#pydantic-ai #Testing #Performance #Developer Experience #Makefile

2026년 2월 17일

[Loki] Bloom Filter로 ExceedsLimits 요청의 백엔드 트래픽 대폭 감소

이미 허용된 스트림을 블룸 필터로 캐싱하여 불필요한 RPC 호출 제거

#Loki #Performance

2026년 2월 17일

[Ray Data] 클러스터 오토스케일러에 논리 메모리 사용률 지표를 추가하여 스케일링 정확도 향상

CPU/GPU/Object Store 메모리만 감시하던 ResourceUtilizationGauge에 논리 메모리를 추가하여, 메모리 부족 시에도 올바르게 스케일업하도록 개선한 분석.

#Ray #Python #Performance #Autoscaler #Observability

2026년 2월 17일

[triton] 컴파일된 커널 모듈 명시적 unload 지원

Triton 런타임에서 컴파일된 커널 모듈을 명시적으로 unload할 수 있도록 __del__ 메서드와 unload_module 드라이버 함수를 추가한 PR을 분석합니다.

#Triton #Runtime #Memory Management #CUDA #HIP

2026년 2월 17일

[Triton] HIPBackend에서 import torch 가드 추가 — JAX 호환성 복원

torch 없는 환경(jax-triton)에서 AMD 백엔드 사용 시 ImportError 수정

#Triton #AMD #Python #Bug Fix #Compatibility

2026년 2월 17일

[triton] NVIDIA TMA im2col 모드 Gluon 튜토리얼 - Convolution 커널 구현

Triton Gluon을 사용하여 NVIDIA Blackwell GPU의 TMA im2col 모드로 Convolution 커널을 구현하는 튜토리얼 PR을 분석합니다.

#Triton #NVIDIA #TMA #Convolution #Gluon

2026년 2월 16일

[triton] AMD GFX1250에서 TDM Software Pipelining 지원

AMD GFX1250 타겟에서 Tensor Descriptor Memory(TDM) 기반 비동기 복사를 software pipelining에 통합하여 matmul 성능을 향상시킨 PR을 분석합니다.

#Triton #AMD GPU #GFX1250 #TDM #Software Pipelining

2026년 2월 17일

[Triton] 서드파티 패키지 다운로드를 setup.py에서 CMake로 이동

2026년 2월 17일

[triton] CLCTryCancel이 Async Proxy를 사용하도록 수정

Triton NVIDIA 백엔드에서 CLCTryCancelOp을 async proxy write로 인식시켜 proxy fence가 올바르게 삽입되도록 수정한 PR 분석.

#Triton #NVIDIA #CLC #ProxyFence #AsyncCopy #BugFix

2026년 2월 16일

[pytorch] CI: TIMM pretrained 모델 캐싱 기능 Revert

PyTorch CI에서 TIMM pretrained 모델을 공유 HF 캐시에 저장하는 기능을 도입했다가, 문제 발생으로 원복한 사례를 분석합니다.

#PyTorch #CI #TIMM #HuggingFace #Caching #Revert

2026년 2월 16일

[pytorch] Inductor: CycleGAN CPU 벤치마크 expected accuracy 상태 업데이트

PyTorch Inductor의 CPU 벤치마크에서 pytorch_CycleGAN_and_pix2pix 모델의 expected 상태를 pass에서 eager_fail_to_run으로 변경한 사례를 분석합니다.

#PyTorch #Inductor #Benchmarks #CI #Accuracy

2026년 2월 16일

[faster-qwen3-tts] 프로젝트 구조 정리: 불필요한 문서 제거와 파일명 표준화

faster-qwen3-tts 프로젝트에서 632줄의 불필요한 문서를 제거하고 핵심 모듈 파일명을 표준화하여 유지보수성을 개선한 리팩토링 사례를 분석합니다.

#Qwen3-TTS #Refactoring #Project Structure #Python #Clean Code

2026년 2월 16일

[논문리뷰] UniWeTok: An Unified Binary Tokenizer with Codebook Size 2^{128} for Unified Multimodal Large Language Model

본 논문은 통합 멀티모달 대규모 언어 모델(MLLM)이 요구하는 고충실도 재구성, 복합적인 의미 추출 및 생성 적합성을 동시에 지원하는 시각적 표현을 제공하는 문제를 해결하고자 합니다.

#Review #Multimodal LLM #Visual Tokenizer #Binary Codebook #Image Generation #Semantic Extraction #Pre-Post Distillation #Hybrid Architecture

2026년 2월 16일