최신 포스트

[논문리뷰] EgoPush: Learning End-to-End Egocentric Multi-Object Rearrangement for Mobile Robots

본 논문은 모바일 로봇이 오직 자기 중심적(egocentric) 시각 관측 만을 사용하여 복잡한 환경에서 여러 객체를 장기적으로 재배열 하는 문제를 해결하는 것을 목표로 합니다.

#Review #Egocentric Perception #Multi-Object Rearrangement #Mobile Robotics #Reinforcement Learning #Teacher-Student Distillation #Non-Prehensile Manipulation #Sim-to-Real Transfer #Object-Centric Representation

2026년 2월 22일

[논문리뷰] Does Your Reasoning Model Implicitly Know When to Stop Thinking?

본 논문은 대규모 추론 모델(LRMs)이 긴 Chain of Thought (CoT) 를 통해 복잡한 추론 작업을 수행할 때 발생하는 상당한 중복과 비효율성 문제를 해결하는 것을 목표로 합니다.

#Review #Large Reasoning Models #Chain of Thought #Efficient Inference #Self-Aware Sampling #Reinforcement Learning #Reasoning Termination #Mathematical Benchmarks

2026년 2월 22일

[논문리뷰] DeepVision-103K: A Visually Diverse, Broad-Coverage, and Verifiable Mathematical Dataset for Multimodal Reasoning

기존 멀티모달 RLVR(Reinforcement Learning with Verifiable Rewards) 학습 데이터셋의 제한적인 다양성, 커버리지, 일반화 능력을 극복하는 것을 목표로 합니다.

#Review #Multimodal Reasoning #Mathematical Dataset #RLVR #Data Curation #Visual Diversity #K12 Mathematics #Large Multimodal Models

2026년 2월 22일

[Open WebUI] 메시지 전송마다 발생하는 불필요한 채팅 JSON 역직렬화 2회 제거

메시지 전송 시 소유권 확인과 폴더 조회를 위해 전체 채팅 JSON을 2번 불필요하게 역직렬화하던 문제를 EXISTS 쿼리와 단일 컬럼 조회로 해결한 PR 분석.

#Open WebUI #Database #SQLAlchemy #Query Optimization #Performance

2026년 2월 21일

[faster-qwen3-tts] 모드 간 성능 동등성 검증 및 벤치마크 비교 문서화

VoiceClone, CustomVoice, ICL 모드가 CUDA graph 캡처 후 동일한 성능을 보이는지 검증하고 벤치마크를 문서화한다

#faster-qwen3-tts #TTS #Benchmark #Documentation

2026년 2월 21일

[triton] AMD gfx1250 MXFP Flash Attention 예제 커널 업데이트

AMD gfx1250 GPU의 MXFP Flash Attention Gluon 예제에서 레이아웃 선택, 공유 메모리 관리, TDM 로드 추상화를 대폭 개선한 PR 분석.

#Triton #AMD #gfx1250 #FlashAttention #MXFP #Gluon

2026년 2월 20일

[faster-qwen3-tts] README 비스트리밍 RTF 수치 업데이트

Jetson AGX Orin의 non-streaming RTF을 1.36에서 1.57로 업데이트하여 최신 벤치마크를 반영한다

#faster-qwen3-tts #TTS #Documentation #Benchmark

2026년 2월 20일

[faster-qwen3-tts] CustomVoice/VoiceDesign 지원, CLI, PyPI 배포, 스트리밍 UX 개선

CustomVoice와 VoiceDesign 모드 지원을 추가하고, CLI 도구와 PyPI 배포를 구현하며 스트리밍 UX를 개선한다

#faster-qwen3-tts #TTS #CLI #CustomVoice

2026년 2월 20일

[triton] AMD TensorDescType의 Shared Memory 크기 계산 수정

WarpSpecialize capture에서 TensorDescType의 크기를 정확히 계산하도록 수정하여 shared memory 할당 오류를 방지한 사례를 분석합니다.

#Triton #AMD #GPU #WarpSpecialize #SharedMemory

2026년 2월 20일

[faster-qwen3-tts] 패키지 리네이밍 및 코드 간소화

qwen3_tts_cuda_graphs에서 faster_qwen3_tts로 리네이밍하고 불필요한 코드를 정리한다

#faster-qwen3-tts #TTS #Refactoring #Naming

2026년 2월 20일

[faster-qwen3-tts] 공식 Qwen3-TTS 기반으로 포팅 및 벤치마크 대폭 향상

커뮤니티 streaming fork에서 공식 Qwen3-TTS 저장소로 기반을 전환하고, repetition penalty 벡터화로 RTF 5.56 달성

#faster-qwen3-tts #TTS #CUDA Graphs #Performance

2026년 2월 20일

[faster-qwen3-tts] 로컬 모델 경로를 HuggingFace Hub ID로 전환하여 배포 간소화

Qwen3-TTS CUDA Graphs 프로젝트에서 하드코딩된 로컬 모델 경로를 HuggingFace Hub ID로 교체하고, config 파싱 로직을 제거하여 코드를 단순화한 사례를 분석합니다.

#Qwen3-TTS #HuggingFace #Model Loading #Python #Refactoring

2026년 2월 20일

[Grafana Loki] 루프 언롤링된 Uvarint 디코더로 delta 인코딩 최적화

표준 라이브러리 Varint 디코더를 루프 언롤링 버전으로 교체하여 delta 디코딩에서 최대 51% 속도 향상을 달성한 분석.

#Grafana Loki #Go #Performance #Encoding #Benchmark #Data Object

2026년 2월 20일

[faster-qwen3-tts] Jetson Thor 벤치마크, streaming TTFA 측정, 블로그 재작성

Jetson Thor 결과를 추가하고, streaming TTFA 측정 방식을 개선하며 블로그 포스트의 수치를 업데이트한다

#faster-qwen3-tts #TTS #Benchmark #Jetson

2026년 2월 20일

[triton] Triton AMD GPU: 버퍼 로드 루프 내 주소 계산 최적화

루프 내 버퍼 로드 시 오프셋 기반 주소 계산을 베이스 포인터 증분 방식으로 변경하여 연산 효율성을 개선했습니다.

#Triton #AMD #Compiler Optimization #MLIR #GPU

2026년 2월 20일

[faster-qwen3-tts] Jetson Thor 벤치마크 결과 추가

NVIDIA Jetson Thor에서의 벤치마크 결과를 README와 블로그에 추가한다

#faster-qwen3-tts #TTS #Benchmark #Jetson Thor

2026년 2월 20일

[triton] MemDescSubslice에서 Non-CTA 차원 슬라이싱 지원

multi-CTA 레이아웃에서 broadcasted CTA와 CTA 차원 분할을 올바르게 처리하도록 메모리 슬라이싱 검증 로직을 개선한 사례를 분석합니다.

#Triton #GPU #MultiCTA #SharedMemory #LinearLayout

2026년 2월 20일

[논문리뷰] World Models for Policy Refinement in StarCraft II

본 논문은 StarCraft II (SC2) 와 같이 복잡하고 부분 관측 가능한(partially observable) 실시간 전략(RTS) 게임 환경에서 대규모 언어 모델(LLM) 기반 에이전트 의 정책 결정 능력을 개선하는 것을 목표로 합니다.

#Review #StarCraft II #World Model #Policy Refinement #Large Language Models #Reinforcement Learning #Partial Observability #Structured Text Representation #Game AI

2026년 2월 19일

[논문리뷰] 'What Are You Doing?': Effects of Intermediate Feedback from Agentic LLM In-Car Assistants During Multi-Step Processing

본 논문은 LLM 기반 에이전트 어시스턴트 가 다단계 작업을 수행할 때 진행 상황과 추론을 어떻게 효과적으로 전달해야 하는지에 대한 문제를 다룹니다.

#Review #Agentic LLM #In-Car Assistants #Human-AI Interaction #Feedback Mechanisms #User Experience #Multi-Step Tasks #Automotive AI #Speech Interfaces

2026년 2월 19일

[논문리뷰] Unified Latents (UL): How to train your latents

확산 모델을 위한 레이턴트 표현 학습에 있어 정보 내용과 재구성 품질 간의 근본적인 트레이드오프 문제를 해결하고자 합니다.

#Review #Diffusion Models #Latent Representation Learning #VAE #Image Generation #Video Generation #Bitrate Control #Training Efficiency #Diffusion Prior #Diffusion Decoder

2026년 2월 19일