[Open WebUI] 스트리밍 중 메시지 리스트 재구성을 프레임당 1회로 제한requestAnimationFrame으로 메시지 리빌드를 쓰로틀링하여 CPU 사용량 감소#Open WebUI#Performance2026년 2월 28일댓글 수 로딩 중
[Open WebUI] Notes.svelte 메모리 누수 수정비동기 onMount와 동기 onDestroy 간의 경쟁 조건을 해소하여 메모리 누수 방지#Open WebUI#Performance2026년 2월 28일댓글 수 로딩 중
[Open WebUI] 모델 생성 페이지 메모리 누수 수정: 이벤트 리스너 해제onMount에서 등록한 message 이벤트 리스너가 해제되지 않아 발생하는 메모리 누수를 수정한 PR 분석.#Open WebUI#Frontend#Memory Leak#Svelte#Event Listener#Bug Fix2026년 2월 28일댓글 수 로딩 중
[Open WebUI] 스트리밍 중 scrollToBottom을 rAF로 배치 처리하여 불필요한 리플로우 제거스트리밍 토큰마다 호출되던 scrollToBottom을 requestAnimationFrame으로 프레임당 최대 1회로 제한하여 레이아웃 리플로우를 대폭 줄인 최적화 분석.#Open WebUI#Svelte#JavaScript#Performance#Scroll#requestAnimationFrame2026년 2월 28일댓글 수 로딩 중
[Open WebUI] JSON.parse(JSON.stringify()) 대신 structuredClone으로 딥 카피 최적화스트리밍 중 매 토큰마다 실행되는 메시지 딥 카피를 structuredClone()으로 교체하여 문자열 직렬화 오버헤드를 제거한 분석.#Open WebUI#JavaScript#Performance#Svelte2026년 2월 28일댓글 수 로딩 중
[Open WebUI] MessageInput 컴포넌트 메모리 누수 수정: 비동기 이벤트 리스너 생명주기 관리Svelte 컴포넌트에서 onMount 비동기 실행과 onDestroy 동기 실행의 타이밍 불일치로 발생하는 이벤트 리스너 메모리 누수를 수정한 PR을 분석합니다.#Open WebUI#Memory Leak#Svelte#Event Listener#Performance2026년 2월 28일댓글 수 로딩 중
[Open WebUI] Tooltip 컴포넌트의 tippy 인스턴스 메모리 누수 수정 및 타입 정의 개선요소 변경 시 이전 tippy 인스턴스가 DOM에 잔존하던 메모리 누수를 destroy 로직 추가로 해결하고, TypeScript 타입을 정밀하게 적용한 분석.#Open WebUI#Svelte#Performance#Memory Leak#TypeScript2026년 2월 28일댓글 수 로딩 중
[triton] Gluon tmem_load에서 Register Layout 자동 추론get_tmem_reg_layout 호출을 제거하고 tensor memory descriptor에서 register layout을 자동으로 추론하도록 BC-breaking 변경을 적용한 사례를 분석합니다.#Triton#Gluon#NVIDIA#Blackwell#TensorMemory2026년 2월 28일댓글 수 로딩 중
[triton] AMD ConvertWarpPipeline에서 AsyncWaitOp 인식 및 Barrier 정렬 수정AMD GPU의 warp pipeline 변환에서 AsyncWaitOp을 barrier로 인식하고 bars 배열 정렬 버그를 수정한 PR 분석.#Triton#AMD#WarpPipeline#AsyncWait#BugFix2026년 2월 27일댓글 수 로딩 중
[pytorch] CI: Inductor 벤치마크 CI 작업을 CUDA 12.8에서 13.0으로 통합 전환PyTorch Inductor의 CI 벤치마크 워크플로우에서 CUDA 12.8과 13.0 이중 빌드를 CUDA 13.0 단일 빌드로 통합하여 CI 리소스를 절약한 사례를 분석합니다.#PyTorch#CI#CUDA#GitHub Actions#Inductor#Benchmarks2026년 2월 27일댓글 수 로딩 중
[Ray] RLlib 커넥터와 배치 유틸리티에 ndarray 빠른 경로 추가tree 순회를 건너뛰는 numpy 배열 최적화로 학습 핫패스 속도 개선#Ray#Performance2026년 2월 27일댓글 수 로딩 중
[Ray] 파이프라인 최적 처리량 계산 유틸리티 함수 추가Ray Data에 파이프라인 연산자별 처리 속도와 리소스 제약을 기반으로 최적 처리량과 리소스 할당을 계산하는 유틸리티 함수를 추가한 PR 분석.#Ray#Ray Data#Resource Allocation#Pipeline Optimization#Throughput#Performance2026년 2월 27일댓글 수 로딩 중
[triton] NVIDIA inval_barrier를 leader CTA에서만 실행하도록 변경multi-CTA 환경에서 broadcasted barrier의 inval_barrier 연산을 leader CTA에서만 실행하도록 수정하여, 올바른 barrier invalidation을 보장하는 PR을 분석합니다.#Triton#NVIDIA#Multi-CTA#Barrier#mbarrier2026년 2월 27일댓글 수 로딩 중
[triton] WSSpecialize에서 초기화된 Barrier의 Invalidation 추가WarpSpecialize 패스가 생성한 mbarrier를 사용 후 올바르게 invalidate하여 재사용 시의 하드웨어 정합성 문제를 방지한 사례를 분석합니다.#Triton#NVIDIA#GPU#WarpSpecialize#Barrier2026년 2월 26일댓글 수 로딩 중
[Open WebUI] KaTeX 모듈 import를 싱글턴으로 캐싱하여 렌더링 최적화Open WebUI에서 수학 수식이 포함된 메시지마다 KaTeX를 반복 import하던 비효율을 Svelte의 context='module'을 활용한 싱글턴 패턴으로 해결한 최적화를 분석합니다.#Open WebUI#Svelte#KaTeX#Performance#Module Cache2026년 2월 26일댓글 수 로딩 중
[faster-qwen3-tts] Windows 네이티브 셋업 및 벤치마크 스크립트 추가setup_windows.bat과 benchmark_windows.bat을 추가하여 WSL 없이 Windows에서 직접 실행할 수 있도록 한다#faster-qwen3-tts#TTS#Windows#DevEx2026년 2월 26일댓글 수 로딩 중
[Open WebUI] ResponseMessage에서 JSON.stringify 비교를 O(1) fast-path로 우회스트리밍 중 매 토큰마다 발생하는 2회의 O(n) JSON.stringify 호출을 content/done 필드 비교로 우회한 분석.#Open WebUI#JavaScript#Performance#Svelte#Streaming2026년 2월 26일댓글 수 로딩 중
[faster-qwen3-tts] 생성 요청 직렬화 및 모델 캐싱 도입asyncio Lock으로 동시 생성을 방지하고, 로드된 모델을 캐싱하여 모델 전환 시 재로딩을 방지한다#faster-qwen3-tts#TTS#Concurrency#Caching2026년 2월 26일댓글 수 로딩 중
[triton] Proton 커널 런처에 더 많은 메타데이터 전달Proton의 metric 커널 런치에 numThreads와 sharedMemBytes 등 추가 메타데이터를 전달하여 GPU 자원 활용을 정밀하게 제어하도록 개선한 사례를 분석합니다.#Triton#Proton#Profiling#GPU#KernelLaunch2026년 2월 26일댓글 수 로딩 중
[vllm] --performance-mode: 워크로드별 최적화 프로파일balanced, interactivity, throughput 3가지 모드로 CUDA Graph 캡처 전략과 배칭 동작을 자동 조정#vllm#Performance2026년 2월 26일댓글 수 로딩 중