[Open WebUI] Notes.svelte 메모리 누수 수정비동기 onMount와 동기 onDestroy 간의 경쟁 조건을 해소하여 메모리 누수 방지#Open WebUI#Performance2026년 2월 28일댓글 수 로딩 중
[Open WebUI] 모델 생성 페이지 메모리 누수 수정: 이벤트 리스너 해제onMount에서 등록한 message 이벤트 리스너가 해제되지 않아 발생하는 메모리 누수를 수정한 PR 분석.#Open WebUI#Frontend#Memory Leak#Svelte#Event Listener#Bug Fix2026년 2월 28일댓글 수 로딩 중
[Open WebUI] 스트리밍 중 scrollToBottom을 rAF로 배치 처리하여 불필요한 리플로우 제거스트리밍 토큰마다 호출되던 scrollToBottom을 requestAnimationFrame으로 프레임당 최대 1회로 제한하여 레이아웃 리플로우를 대폭 줄인 최적화 분석.#Open WebUI#Svelte#JavaScript#Performance#Scroll#requestAnimationFrame2026년 2월 28일댓글 수 로딩 중
[Open WebUI] JSON.parse(JSON.stringify()) 대신 structuredClone으로 딥 카피 최적화스트리밍 중 매 토큰마다 실행되는 메시지 딥 카피를 structuredClone()으로 교체하여 문자열 직렬화 오버헤드를 제거한 분석.#Open WebUI#JavaScript#Performance#Svelte2026년 2월 28일댓글 수 로딩 중
[Open WebUI] MessageInput 컴포넌트 메모리 누수 수정: 비동기 이벤트 리스너 생명주기 관리Svelte 컴포넌트에서 onMount 비동기 실행과 onDestroy 동기 실행의 타이밍 불일치로 발생하는 이벤트 리스너 메모리 누수를 수정한 PR을 분석합니다.#Open WebUI#Memory Leak#Svelte#Event Listener#Performance2026년 2월 28일댓글 수 로딩 중
[Open WebUI] Tooltip 컴포넌트의 tippy 인스턴스 메모리 누수 수정 및 타입 정의 개선요소 변경 시 이전 tippy 인스턴스가 DOM에 잔존하던 메모리 누수를 destroy 로직 추가로 해결하고, TypeScript 타입을 정밀하게 적용한 분석.#Open WebUI#Svelte#Performance#Memory Leak#TypeScript2026년 2월 28일댓글 수 로딩 중
[triton] Gluon tmem_load에서 Register Layout 자동 추론get_tmem_reg_layout 호출을 제거하고 tensor memory descriptor에서 register layout을 자동으로 추론하도록 BC-breaking 변경을 적용한 사례를 분석합니다.#Triton#Gluon#NVIDIA#Blackwell#TensorMemory2026년 2월 28일댓글 수 로딩 중
[triton] AMD ConvertWarpPipeline에서 AsyncWaitOp 인식 및 Barrier 정렬 수정AMD GPU의 warp pipeline 변환에서 AsyncWaitOp을 barrier로 인식하고 bars 배열 정렬 버그를 수정한 PR 분석.#Triton#AMD#WarpPipeline#AsyncWait#BugFix2026년 2월 27일댓글 수 로딩 중
[pytorch] CI: Inductor 벤치마크 CI 작업을 CUDA 12.8에서 13.0으로 통합 전환PyTorch Inductor의 CI 벤치마크 워크플로우에서 CUDA 12.8과 13.0 이중 빌드를 CUDA 13.0 단일 빌드로 통합하여 CI 리소스를 절약한 사례를 분석합니다.#PyTorch#CI#CUDA#GitHub Actions#Inductor#Benchmarks2026년 2월 27일댓글 수 로딩 중
[Ray] RLlib 커넥터와 배치 유틸리티에 ndarray 빠른 경로 추가tree 순회를 건너뛰는 numpy 배열 최적화로 학습 핫패스 속도 개선#Ray#Performance2026년 2월 27일댓글 수 로딩 중
[Ray] 파이프라인 최적 처리량 계산 유틸리티 함수 추가Ray Data에 파이프라인 연산자별 처리 속도와 리소스 제약을 기반으로 최적 처리량과 리소스 할당을 계산하는 유틸리티 함수를 추가한 PR 분석.#Ray#Ray Data#Resource Allocation#Pipeline Optimization#Throughput#Performance2026년 2월 27일댓글 수 로딩 중
[triton] NVIDIA inval_barrier를 leader CTA에서만 실행하도록 변경multi-CTA 환경에서 broadcasted barrier의 inval_barrier 연산을 leader CTA에서만 실행하도록 수정하여, 올바른 barrier invalidation을 보장하는 PR을 분석합니다.#Triton#NVIDIA#Multi-CTA#Barrier#mbarrier2026년 2월 27일댓글 수 로딩 중
[논문리뷰] veScale-FSDP: Flexible and High-Performance FSDP at Scale본 논문은 기존 FSDP(Fully Sharded Data Parallel) 시스템이 블록-wise 양자화 훈련 이나 Shampoo, Muon 과 같은 비-요소별(non-element-wise) 옵티마이저 를 사용하는 구조 인식 훈련(structure-aware training) 에서 겪는 한계를 해결하고자 합니다.#Review#FSDP#Distributed Training#LLM#GPU Scaling#Memory Optimization#Performance Optimization#Structure-Aware Training#RaggedShard2026년 2월 26일댓글 수 로딩 중
[논문리뷰] The Trinity of Consistency as a Defining Principle for General World Models본 논문은 최신 생성 AI 모델들이 시각적으로 그럴듯한 결과물을 생성하지만, 물리 법칙과 인과 관계를 이해하는 데 한계를 보이는 문제를 해결하고자 합니다.#Review#World Models#Multimodal Generative AI#Consistency Theory#Spatial-Temporal Reasoning#Causal Simulation#AI Benchmarking#Artificial General Intelligence2026년 2월 26일댓글 수 로딩 중
[논문리뷰] Search More, Think Less: Rethinking Long-Horizon Agentic Search for Efficiency and Generalization이 논문은 기존 딥 리서치 에이전트의 높은 추론 비용과 지연 시간, 그리고 이질적인 연구 환경 전반에 걸친 낮은 일반화 성능이라는 두 가지 주요 문제를 해결하는 것을 목표로 합니다. 특히, 장기적인(long-horizon) 에이전트 검색 태스크에서 효율성과 일반화 능력을 동시에 향상시키고자 합니다.#Review#Agentic AI#Long-Horizon Search#Parallel Execution#Data Synthesis#Reinforcement Learning#Generalization#Efficiency#LLM Agent2026년 2월 26일댓글 수 로딩 중
[논문리뷰] Risk-Aware World Model Predictive Control for Generalizable End-to-End Autonomous Driving이 논문은 전문가 행동 데이터에 대한 의존성으로 인해 발생하는 기존 End-to-End 자율주행(E2E-AD) 시스템의 제한적인 일반화 문제와 롱테일 시나리오에서의 불안전한 결정 문제를 해결하고자 합니다.#Review#End-to-End Autonomous Driving#World Model Predictive Control#Risk-Aware#Generalization#Self-Supervised Learning#Scenario Exploration#Autonomous Systems2026년 2월 26일댓글 수 로딩 중
[논문리뷰] OmniGAIA: Towards Native Omni-Modal AI Agents본 연구는 현재 바이모달 상호작용에 국한된 멀티모달 LLM의 한계를 넘어, 인간의 지능처럼 영상, 오디오, 이미지 모달리티 전반에 걸쳐 통합적으로 인지하고 추론하며 외부 도구를 사용하는 네이티브 옴니모달 AI 에이전트 를 개발하고 평가하는 것을 목표로 합니다.#Review#Omni-modal AI#Multi-modal Agents#Tool-Integrated Reasoning#Benchmark#Event Graph#Active Perception#Trajectory Synthesis#DPO2026년 2월 26일댓글 수 로딩 중
[논문리뷰] MobilityBench: A Benchmark for Evaluating Route-Planning Agents in Real-World Mobility Scenarios본 논문은 다양한 라우팅 요구, 비결정론적 매핑 서비스, 제한된 재현성으로 인해 복잡한 실세계 모빌리티 시나리오에서 LLM 기반 경로 계획 에이전트 의 체계적인 평가가 어렵다는 문제를 해결하고자 합니다.#Review#Large Language Models#Route Planning Agents#Benchmarking#Real-World Mobility#API Replay Sandbox#Multi-dimensional Evaluation#Tool-augmented Agents2026년 2월 26일댓글 수 로딩 중
[논문리뷰] MediX-R1: Open Ended Medical Reinforcement Learning본 논문은 의료 멀티모달 대규모 언어 모델(MLLM)이 다지선다형 질문을 넘어 임상적으로 근거한 자유 형식 답변 을 생성하도록 하는 오픈엔드 의료 강화 학습(RL) 프레임워크인 MediX-R1 을 제안합니다.#Review#Reinforcement Learning#Multimodal LLMs#Medical AI#Composite Reward#LLM-as-a-Judge#Open-ended Generation#Medical Imaging2026년 2월 26일댓글 수 로딩 중
[논문리뷰] Imagination Helps Visual Reasoning, But Not Yet in Latent Space본 논문은 Multimodal Large Language Models (MLLMs)에서 잠재 공간(latent space)을 활용한 시각적 추론(Latent Visual Reasoning, LVR)의 효과와 내재된 메커니즘을 심층적으로 분석하고, 그 한계를 극복하기 위한 대안적인 접근 방식을 제시하는 것을 목표로 합니다.#Review#Visual Reasoning#Latent Space#Causal Mediation Analysis#Multimodal LLMs#Textual Imagination#Model Interpretation#Latent Tokens2026년 2월 26일댓글 수 로딩 중