최신 포스트

[Loki] memory 서브패키지 통합으로 코드 구조 개선

memory/bitmap, memory/buffer를 memory 패키지로 통합하여 중복 제거

#Grafana Loki #Go #Refactoring #Performance

2026년 1월 16일

[Ray Serve] 레플리카 라우팅 데이터 구조 최적화: O(n) 스캔을 O(1) 딕셔너리 룩업으로 교체

Ray Serve의 요청 라우터에서 O(n) 선형 스캔을 O(1) 딕셔너리 인덱스로 교체하고, 해시 캐싱과 메트릭 쓰로틀링을 추가한 종합 최적화 분석.

#Ray #Python #Performance #Data Structures #Serving

2026년 1월 16일

[Triton] TritonGPU Barrier 재설계 — 주소 공간별 메모리 가시성 보장

gpu.barrier를 TritonGPU 전용 barrier op으로 교체하여 shared/global 메모리 가시성을 세밀하게 제어한다

#Triton #MLIR #GPU Barrier #Memory Visibility #Compiler Infrastructure

2026년 1월 16일

[triton] Warp Specialization: 데이터 플로우 그래프 기반의 개선된 파티션 스케줄링 패스

기존 파티션 스케줄링을 데이터 플로우 그래프와 incremental heuristic merging 기반으로 재작성하여 범용성을 높인 분석.

#Triton #Warp Specialization #Partition Scheduling #Data Flow Graph #Compiler #MLIR

2026년 1월 16일

[Loki] Delta Decoder 최적화로 3배 처리량 개선

streamio.Reader 인터페이스 제거와 직접 바이트 슬라이스 접근으로 delta decoder 성능 60% 향상.

#Grafana Loki #Go #Performance #Encoding #Data Pipeline

2026년 1월 15일

[triton] moveUpTranspose 최적화 제거 PR의 Revert - 회귀 방지

일부 워크로드에서 성능 회귀를 유발한 moveUpTranspose 제거를 되돌려, TransposeOp 재배치 최적화를 복원한 PR을 분석합니다.

#Triton #AMD #Revert #Performance #Regression

2026년 1월 15일

[논문리뷰] VQ-Seg: Vector-Quantized Token Perturbation for Semi-Supervised Medical Image Segmentation

본 논문은 반지도 학습 기반 의료 영상 분할에서 기존 dropout 방식의 불안정하고 튜닝이 어려운 특성 교란 문제를 해결하고자 합니다.

#Review #Semi-supervised Learning #Medical Image Segmentation #Vector Quantization #Consistency Learning #Feature Perturbation #Foundation Models #Dropout Replacement

2026년 1월 15일

[논문리뷰] VIBE: Visual Instruction Based Editor

본 논문은 기존의 대규모 및 고비용 이미지 편집 모델의 한계를 극복하고, 오픈소스 기반의 초고속, 컴팩트한 시각적 지시 기반 이미지 편집 시스템을 개발하는 것을 목표로 합니다.

#Review #Instruction-Based Image Editing #Diffusion Models #Vision-Language Models (VLM)#Model Efficiency #Multi-stage Training #Preference Alignment #Source Consistency

2026년 1월 15일

[논문리뷰] Urban Socio-Semantic Segmentation with Vision-Language Reasoning

본 논문은 위성 이미지에서 건물이나 수역과 같은 물리적 속성이 아닌, 학교나 공원과 같은 사회적으로 정의된 도시의 의미론적 개체 를 정확하게 분할하는 새로운 도전 과제인 도시 사회-의미론적 분할(Urban Socio-Semantic Segmentation)을 해결하는 것을 목표로 합니다.

#Review #Urban Segmentation #Socio-Semantic #Vision-Language Models (VLMs)#Reinforcement Learning #Geospatial Data #Multi-modal Reasoning #SAM

2026년 1월 15일

[논문리뷰] Transition Matching Distillation for Fast Video Generation

대규모 비디오 Diffusion 모델이 고품질 비디오를 생성하지만, 다단계 샘플링 과정의 비효율성으로 인해 실시간 상호작용 애플리케이션에 적용하기 어렵다는 문제를 해결하고자 합니다.

#Review #Video Generation #Diffusion Models #Model Distillation #Few-Step Sampling #Transition Matching #Flow Matching #DMD2 #Efficiency

2026년 1월 15일

[논문리뷰] Toward Ultra-Long-Horizon Agentic Science: Cognitive Accumulation for Machine Learning Engineering

본 논문은 에이전트 기반 과학에서 초장기 자율성(ultra-long-horizon autonomy) 의 핵심 병목 현상을 해결하고자 합니다.

#Review #Agentic AI #Long-Horizon Autonomy #Cognitive Accumulation #Hierarchical Cognitive Caching (HCC)#Context Management #Machine Learning Engineering (MLE)#LLM Agents

2026년 1월 15일

[논문리뷰] ToolSafe: Enhancing Tool Invocation Safety of LLM-based agents via Proactive Step-level Guardrail and Feedback

본 논문은 LLM 기반 에이전트의 도구 호출 기능에서 발생하는 보안 위험을 해결하는 것을 목표로 합니다.

#Review #LLM Agents #Tool Use Safety #Guardrail #Step-level Safety Detection #Prompt Injection #Reinforcement Learning #Feedback Framework

2026년 1월 15일

[논문리뷰] Think-Then-Generate: Reasoning-Aware Text-to-Image Diffusion with LLM Encoders

본 논문은 기존 텍스트-이미지(T2I) 확산 모델들이 대규모 언어 모델(LLM) 기반 텍스트 인코더 를 단순히 특징 추출기로 사용하여 추론 능력을 충분히 활용하지 못하는 한계를 해결하고자 합니다.

#Review #Text-to-Image #Diffusion Models #LLM Encoders #Reasoning-Aware AI #Reinforcement Learning #Dual-GRPO #Prompt Rewriting

2026년 1월 15일

[논문리뷰] STEP3-VL-10B Technical Report

본 연구는 경량화된 오픈소스 파운데이션 모델인 STEP3-VL-10B 를 통해 효율성과 최첨단 멀티모달 지능 간의 균형을 재정의하는 것을 목표로 합니다. 특히, 제한된 파라미터 예산 내에서 복잡한 추론 및 지각 능력을 발전시키는 데 중점을 둡니다.

#Review #Multimodal Large Language Models #Vision-Language Models #Reinforcement Learning #Parallel Coordinated Reasoning #Model Efficiency #Foundation Models #Pre-training #Post-training

2026년 1월 15일

[논문리뷰] Rewarding the Rare: Uniqueness-Aware RL for Creative Problem Solving in LLMs

LLM의 RL 기반 학습에서 발생하는 탐색 붕괴(exploration collapse) 문제를 해결하는 것이 목표입니다.

#Review #Reinforcement Learning (RL)#Large Language Models (LLMs)#Exploration Collapse #Strategy-level Diversity #Uniqueness-Aware Rewarding #Creative Problem Solving #Pass@k

2026년 1월 15일

[논문리뷰] Molmo2: Open Weights and Data for Vision-Language Models with Video Understanding and Grounding

현재 가장 강력한 비디오-언어 모델(VLM)들이 대부분 독점적이거나, 독점 모델의 데이터를 증류하여 생성되거나, 훈련 데이터 및 방법론을 공개하지 않는 문제를 해결하고자 합니다.

#Review #Vision-Language Models #Video Understanding #Grounding #Open Weights #Open Data #Multimodal AI #Object Tracking #Dense Captioning

2026년 1월 15일

[논문리뷰] MatchTIR: Fine-Grained Supervision for Tool-Integrated Reasoning via Bipartite Matching

본 논문은 Tool-Integrated Reasoning (TIR) 에서 기존 강화 학습 방법론이 획일적인 보상 할당 으로 인해 비효율적인 도구 사용 최적화를 초래하는 문제를 해결하고자 합니다.

#Review #Tool-Integrated Reasoning #LLMs #Reinforcement Learning #Fine-Grained Supervision #Bipartite Matching #Credit Assignment #Advantage Estimation

2026년 1월 15일

[논문리뷰] LSRIF: Logic-Structured Reinforcement Learning for Instruction Following

본 논문은 대규모 언어 모델(LLMs)이 복잡한 실세계 명령, 특히 순차적 의존성이나 조건부 분기와 같은 논리적 구조 를 포함하는 명령을 따르는 데 어려움을 겪는 문제를 해결하고자 합니다.

#Review #Instruction Following #Reinforcement Learning #Logical Structures #LLMs #Reward Modeling #Dataset Construction #Attention Mechanism

2026년 1월 15일

[논문리뷰] FlowAct-R1: Towards Interactive Humanoid Video Generation

본 논문은 실시간 상호작용이 가능한 휴머노이드 비디오 생성을 목표로 하며, 기존 비디오 합성 방법론이 고품질 합성 및 실시간 상호작용 요구사항 사이에서 겪는 한계를 극복하고자 합니다. 특히, 연속적이고 반응적인 방식으로 인간과 상호작용할 수 있는 생체와 같은 시각적 에이전트를 합성하는 것을 주된 연구 목적으로 합니다.

#Review #Interactive Video Generation #Humanoid Synthesis #Real-time #Streaming Diffusion #MMDiT #Temporal Consistency #Multimodal Control #Low Latency

2026년 1월 15일

[논문리뷰] EvasionBench: Detecting Evasive Answers in Financial Q&A via Multi-Model Consensus and LLM-as-Judge

본 논문은 금융 Q&A에서 회피성 답변(evasive answers) 을 탐지하는 데 필요한 대규모 고품질 벤치마크 부재 와 모호한 경계 사례에 대한 일관성 없는 레이블링 문제를 해결하고자 합니다. 특히 부분적으로 응답하는 답변과 완전한 회피성 답변 사이의 미묘한 경계에 대한 양질의 감독 데이터 확보를 목표로 합니다.

#Review #Evasion Detection #Financial NLP #Large Language Models (LLMs)#Multi-Model Consensus #LLM-as-Judge #Data Annotation #Knowledge Distillation #Hard Sample Mining

2026년 1월 15일