최신 포스트

[논문리뷰] LLaDA-o: An Effective and Length-Adaptive Omni Diffusion Model

본 논문은 멀티모달 이해 및 생성 분야에서 확산 언어 모델의 잠재력을 탐구하며, 텍스트와 이미지라는 근본적으로 다른 확산 역학을 통합하는 데 따르는 비효율성과 고정된 출력 길이의 한계를 해결하고자 합니다.

#Review #Omni Diffusion Model #Multimodal AI #Length Adaptation #Mixture of Diffusion #Discrete Diffusion #Continuous Diffusion #Text-to-Image Generation

2026년 3월 2일

[논문리뷰] Half-Truths Break Similarity-Based Retrieval

본 논문은 CLIP-스타일 이중 인코더 가 '하프 트루스(half-truths)'에 취약하여, 이미지에 대해 정확하지만 짧은 설명보다 그럴듯하지만 오류가 추가된 긴 설명(half-truth) 에 더 높은 유사도를 부여하는 문제를 해결하고자 합니다.

#Review #Vision-Language Models #CLIP #Compositional Reasoning #Image-Text Retrieval #Fine-tuning #Hard Negatives #Unit-level Supervision #Half-Truths

2026년 3월 2일

[논문리뷰] From Scale to Speed: Adaptive Test-Time Scaling for Image Editing

본 논문은 이미지 편집 작업의 고유한 특성(목표 지향적, 소스 이미지 및 지침에 의한 제약)을 고려하여, 기존 텍스트-투-이미지(T2I) 중심의 Image Chain-of-Thought (Image-CoT) 방법론의 비효율성을 해결 하는 것을 목표로 합니다.

#Review #Image Editing #Test-Time Scaling #Chain-of-Thought #Diffusion Models #Adaptive Resource Allocation #Edit-Specific Verification #Opportunistic Stopping

2026년 3월 2일

[논문리뷰] Efficient RLVR Training via Weighted Mutual Information Data Selection

본 논문은 대규모 언어 모델(LLMs)의 강화 학습(RL) 훈련 과정에서 발생하는 데이터 선택의 비효율성 문제를 해결하고자 합니다.

#Review #Reinforcement Learning #Data Selection #Mutual Information #Epistemic Uncertainty #LLMs #RLVR #Training Efficiency

2026년 3월 2일

[논문리뷰] CoVe: Training Interactive Tool-Use Agents via Constraint-Guided Verification

본 논문은 실제 사용자 요구가 복잡하고 모호함에도 불구하고, 에이전트가 정확한 도구 실행을 통해 이를 충족해야 하는 다중 턴 대화형 도구 사용 에이전트 개발의 근본적인 과제를 해결하고자 합니다.

#Review #Tool-Use Agents #Multi-turn Interaction #Data Synthesis #Constraint-Guided Verification #Large Language Models #Supervised Fine-tuning #Reinforcement Learning

2026년 3월 2일

[논문리뷰] CharacterFlywheel: Scaling Iterative Improvement of Engaging and Steerable LLMs in Production

본 논문은 Instagram, WhatsApp, Messenger와 같은 프로덕션 환경의 소셜 챗 애플리케이션에서 LLM 의 사용자 참여도와 조종성(steerability)을 반복적으로 개선하는 CharacterFlywheel 이라는 이터레이션 프로세스를 제시합니다.

#Review #LLM #Social Chat #Engagement Optimization #Steerability #Reinforcement Learning #Reward Modeling #A/B Testing #Iterative Development

2026년 3월 2일

[논문리뷰] CHIMERA: Compact Synthetic Data for Generalizable LLM Reasoning

본 논문은 LLM의 추론 후속 훈련 과정에서 발생하는 콜드 스타트 문제, 제한된 도메인 커버리지, 주석 병목 현상 이라는 세 가지 핵심 데이터 관련 문제를 해결하는 것을 목표로 합니다. 특히, 인간 주석 없이 컴팩트하면서도 일반화 가능한 고품질 합성 추론 데이터셋 을 구축하여 이 문제를 해결하고자 합니다.

#Review #Synthetic Data #LLM Reasoning #Chain-of-Thought #Data Efficiency #Post-training #Generalization #Quality Control #Domain Coverage

2026년 3월 2일

[pydantic-ai] 병렬 도구 실행 시 예외 발생 시 형제 태스크 취소 버그 수정

asyncio 병렬 도구 실행에서 CancelledError 외 예외 발생 시 형제 태스크가 고아 상태로 남는 버그를 수정한 사례를 분석합니다.

#pydantic-ai #asyncio #Python #Bug Fix #Concurrency

2026년 3월 2일

[Ray] 워커 리스너 스레드 최적화: list를 frozenset으로 교체

에러 메시지 폴링 루프에서 매번 생성되던 리스트를 frozenset으로 캐싱

#Ray #Performance

2026년 3월 2일

[Triton] FenceAsync에 비동기 읽기 의존성 추가 — st.shared와 copy_local_to_global 간 정합성 보장

비동기 프록시 읽기 연산에 대한 fence 삽입 누락 버그를 수정하여 공유 메모리 쓰기와 글로벌 복사 간 데이터 정합성을 보장한다

#Triton #MLIR #NVIDIA #Memory Fence #GPU Compiler

2026년 3월 2일

[axolotl] Context Parallelism batch_size 및 total_num_steps 계산 수정

Context Parallel 환경에서 batch_size가 과대 계산되고 total_num_steps에 CP size가 잘못 곱해지던 버그를 effective dp world_size 기반으로 수정한 사례를 분석합니다.

#Axolotl #Context Parallel #Distributed Training #Bug Fix

2026년 3월 2일

[axolotl] SchedulerMixin.create_scheduler() optimizer 누락 버그 수정

create_scheduler에 optimizer가 전달되지 않았을 때 self.optimizer로 fallback하지 않아 발생하는 에러를 수정한 사례를 분석합니다.

#Axolotl #Scheduler #Bug Fix #Training

2026년 3월 2일

[feast] Feast Redis 온라인 스토어 Protobuf 파싱 최적화

불필요한 bytes() 변환 제거와 코드 간소화로 Redis 온라인 스토어 응답 처리 최적화

#Python #Redis #Protobuf #Performance #Feature Store

2026년 3월 2일

[Open WebUI] ChatControls 컴포넌트 메모리 누수 수정

onMount/onDestroy 비동기 타이밍 문제를 해결하여 DOM 트리 메모리 누수 방지

#Open WebUI #Performance

2026년 3월 2일

[Ray Autoscaler] ALLOCATION_TIMEOUT에서 TERMINATED로의 상태 전이 허용

KubeRay 파드가 할당 타임아웃 후 사라졌을 때 상태 머신이 TERMINATED 전이를 거부하여 발생하던 assertion 오류를 수정한 분석.

#Ray #Python #Bug Fix #Autoscaler #KubeRay

2026년 3월 2일

[Ray Serve] Controller 마이크로벤치마크 공식 추가

Serve Controller의 루프 속도, 이벤트 루프 지연, 메모리 사용량 등을 측정하는 공식 벤치마크 도입.

#Ray #Python #Performance #Benchmark #Serve

2026년 3월 1일

[Open WebUI] Chat.svelte 비동기 onMount 메모리 누수 수정

비동기 onMount와 동기 onDestroy 간 타이밍 불일치로 인한 DOM 트리 메모리 누수 해결.

#Open WebUI #Svelte #Performance #Memory Leak #Lifecycle

2026년 3월 1일

[Open WebUI] 사용자 메모리 컬렉션 쿼리에 소유권 검증 추가

user-memory 및 file 컬렉션에 대한 접근 권한 검증을 공통 함수로 추출하여 보안 강화.

#Open WebUI #Python #Security #Performance #Refactoring

2026년 3월 1일

[Open WebUI] buildMessages에서 불필요한 객체 스프레드 제거

매 프레임마다 생성되던 100개의 불필요한 복사 객체를 제거하여 GC 부담 감소

#Open WebUI #Performance

2026년 3월 1일

[Open WebUI] MultiResponseMessages에 O(1) Fast-path 비교 추가

JSON.stringify 전체 비교 전에 content/done 필드를 먼저 체크하여 스트리밍 렌더링 최적화.

#Open WebUI #Svelte #Performance #Frontend #Rendering

2026년 3월 1일