[pydantic-ai] 병렬 도구 실행 시 예외 발생 시 형제 태스크 취소 버그 수정asyncio 병렬 도구 실행에서 CancelledError 외 예외 발생 시 형제 태스크가 고아 상태로 남는 버그를 수정한 사례를 분석합니다.#pydantic-ai#asyncio#Python#Bug Fix#Concurrency2026년 3월 2일댓글 수 로딩 중
[Ray] 워커 리스너 스레드 최적화: list를 frozenset으로 교체에러 메시지 폴링 루프에서 매번 생성되던 리스트를 frozenset으로 캐싱#Ray#Performance2026년 3월 2일댓글 수 로딩 중
[Triton] FenceAsync에 비동기 읽기 의존성 추가 — st.shared와 copy_local_to_global 간 정합성 보장비동기 프록시 읽기 연산에 대한 fence 삽입 누락 버그를 수정하여 공유 메모리 쓰기와 글로벌 복사 간 데이터 정합성을 보장한다#Triton#MLIR#NVIDIA#Memory Fence#GPU Compiler2026년 3월 2일댓글 수 로딩 중
[axolotl] Context Parallelism batch_size 및 total_num_steps 계산 수정Context Parallel 환경에서 batch_size가 과대 계산되고 total_num_steps에 CP size가 잘못 곱해지던 버그를 effective dp world_size 기반으로 수정한 사례를 분석합니다.#Axolotl#Context Parallel#Distributed Training#Bug Fix2026년 3월 2일댓글 수 로딩 중
[axolotl] SchedulerMixin.create_scheduler() optimizer 누락 버그 수정create_scheduler에 optimizer가 전달되지 않았을 때 self.optimizer로 fallback하지 않아 발생하는 에러를 수정한 사례를 분석합니다.#Axolotl#Scheduler#Bug Fix#Training2026년 3월 2일댓글 수 로딩 중
[feast] Feast Redis 온라인 스토어 Protobuf 파싱 최적화불필요한 bytes() 변환 제거와 코드 간소화로 Redis 온라인 스토어 응답 처리 최적화#Python#Redis#Protobuf#Performance#Feature Store2026년 3월 2일댓글 수 로딩 중
[Open WebUI] ChatControls 컴포넌트 메모리 누수 수정onMount/onDestroy 비동기 타이밍 문제를 해결하여 DOM 트리 메모리 누수 방지#Open WebUI#Performance2026년 3월 2일댓글 수 로딩 중
[Ray Autoscaler] ALLOCATION_TIMEOUT에서 TERMINATED로의 상태 전이 허용KubeRay 파드가 할당 타임아웃 후 사라졌을 때 상태 머신이 TERMINATED 전이를 거부하여 발생하던 assertion 오류를 수정한 분석.#Ray#Python#Bug Fix#Autoscaler#KubeRay2026년 3월 2일댓글 수 로딩 중
[Ray Serve] Controller 마이크로벤치마크 공식 추가Serve Controller의 루프 속도, 이벤트 루프 지연, 메모리 사용량 등을 측정하는 공식 벤치마크 도입.#Ray#Python#Performance#Benchmark#Serve2026년 3월 1일댓글 수 로딩 중
[Open WebUI] Chat.svelte 비동기 onMount 메모리 누수 수정비동기 onMount와 동기 onDestroy 간 타이밍 불일치로 인한 DOM 트리 메모리 누수 해결.#Open WebUI#Svelte#Performance#Memory Leak#Lifecycle2026년 3월 1일댓글 수 로딩 중
[Open WebUI] 사용자 메모리 컬렉션 쿼리에 소유권 검증 추가user-memory 및 file 컬렉션에 대한 접근 권한 검증을 공통 함수로 추출하여 보안 강화.#Open WebUI#Python#Security#Performance#Refactoring2026년 3월 1일댓글 수 로딩 중
[Open WebUI] buildMessages에서 불필요한 객체 스프레드 제거매 프레임마다 생성되던 100개의 불필요한 복사 객체를 제거하여 GC 부담 감소#Open WebUI#Performance2026년 3월 1일댓글 수 로딩 중
[Open WebUI] MultiResponseMessages에 O(1) Fast-path 비교 추가JSON.stringify 전체 비교 전에 content/done 필드를 먼저 체크하여 스트리밍 렌더링 최적화.#Open WebUI#Svelte#Performance#Frontend#Rendering2026년 3월 1일댓글 수 로딩 중
[Open WebUI] JSON.parse(JSON.stringify()) 를 structuredClone으로 교체Chat.svelte의 7곳에서 깊은 복사 방식을 네이티브 structuredClone API로 변경하여 성능 2배 개선.#Open WebUI#Svelte#JavaScript#Performance#Deep Clone2026년 3월 1일댓글 수 로딩 중
[Open WebUI] CodeBlock 토큰 비교 fast-path 최적화JSON.stringify 대신 O(1) 필드 비교로 스트리밍 렌더링 성능 개선#Open WebUI#Svelte#Rendering Optimization#Performance2026년 3월 1일댓글 수 로딩 중
[논문리뷰] dLLM: Simple Diffusion Language Modeling이 논문은 확산 언어 모델(DLM) 의 훈련, 추론, 평가를 아우르는 통합된 오픈소스 프레임워크인 dLLM 을 제공하는 것을 목표로 합니다. DLM 연구의 진입 장벽을 낮추고, 기존 모델의 재현, 파인튜닝, 비교를 용이하게 하며, 새로운 DLM 설계 통합을 단순화하고자 합니다.#Review#Diffusion Language Models#Open-source Framework#Modular Design#Masked Diffusion#Block Diffusion#Language Model Finetuning#Efficient Inference#Evaluation Pipeline2026년 3월 1일댓글 수 로딩 중
[논문리뷰] Vectorizing the Trie: Efficient Constrained Decoding for LLM-based Generative Retrieval on AcceleratorsLLM 기반 생성형 검색(Generative Retrieval)은 추천 시스템의 강력한 패러다임이지만, 산업 환경에서 요구되는 출력 공간 제약(constrained output space) 을 기본 자기회귀 디코딩(autoregressive decoding) 이 지원하지 못하는 문제가 있습니다.#Review#Generative Retrieval#Constrained Decoding#Trie#Sparse Matrix#TPU#GPU#Recommendation Systems#LLM2026년 3월 1일댓글 수 로딩 중
[논문리뷰] SenCache: Accelerating Diffusion Model Inference via Sensitivity-Aware Caching확산 모델의 추론 과정을 가속화하는 것이 목표입니다. 특히, 기존의 휴리스틱 기반 캐싱 방법들이 가진 이론적 근거 부족과 정적 캐싱 스케줄의 한계를 극복하고, 모델 출력 품질을 유지하면서 계산 비용을 줄일 수 있는 원칙적인(principled) 민감도 기반 캐싱 프레임워크 를 제안합니다.#Review#Diffusion Models#Inference Acceleration#Caching#Sensitivity Analysis#Dynamic Caching#Video Generation#Denoising2026년 3월 1일댓글 수 로딩 중
[논문리뷰] Ref-Adv: Exploring MLLM Visual Reasoning in Referring Expression Tasks본 연구는 기존 참조 표현 이해(REC) 벤치마크( RefCOCO/+/g )가 짧은 표현, 적은 방해물, 중복 설명으로 인한 grounding shortcut 등으로 MLLM 의 진정한 시각적 추론 및 접지 능력을 제대로 평가하지 못한다는 문제점을 해결하고자 합니다.#Review#Referring Expression Comprehension#MLLM#Visual Reasoning#Benchmark Dataset#Hard Distractors#Grounding Shortcuts#Chain-of-Thought#Negation2026년 3월 1일댓글 수 로딩 중
[논문리뷰] Recovered in Translation: Efficient Pipeline for Automated Translation of Benchmarks and Datasets현재 다국어 LLM 평가 의 신뢰도를 저해하는 번역 벤치마크의 일관성 없는 품질(의미론적 드리프트 및 문맥 손실) 문제를 해결하는 것입니다. 본 연구는 데이터셋과 벤치마크를 확장 가능하고 고품질 로 번역하며, 원본 작업 구조와 언어적 뉘앙스를 보존하는 완전 자동화된 프레임워크를 제시하는 것을 목표로 합니다.#Review#Automated Translation#Large Language Models#Multilingual Benchmarks#Benchmark Quality#Test-time Scaling#Universal Self-Improvement#Translation Ranking#Eastern European Languages2026년 3월 1일댓글 수 로딩 중