[triton] AMD TargetInfo에 16/32비트 Elementwise 벡터화 지원 추가AMD GPU의 TargetInfo에 supportBitwidth16Elementwise와 supportBitwidth32Elementwise를 활성화하여 reduction 코드 생성을 최적화한 PR을 분석합니다.#Triton#AMD#Vectorization#Reduction#GFX12502026년 2월 19일댓글 수 로딩 중
[pytorch] Benchmark: Inductor 벤치마크에서 CycleGAN 모델 제거PyTorch Inductor 벤치마크에서 pytorch_CycleGAN_and_pix2pix 모델을 24개 expected accuracy CSV에서 일괄 제거하여 CI 안정성을 개선한 사례를 분석합니다.#PyTorch#Inductor#Benchmarks#CI#CycleGAN2026년 2월 19일댓글 수 로딩 중
[Open WebUI] 채팅 목록 조회 시 불필요한 전체 JSON 로딩 제거Open WebUI의 고정/보관/공유 채팅 목록 API에서 전체 ChatModel을 로딩하던 것을 with_entities()로 필요한 컬럼만 조회하도록 변경하여 DB 부하와 메모리 사용량을 줄인 최적화를 분석합니다.#Open WebUI#Python#SQLAlchemy#Database#Performance#Query Optimization2026년 2월 19일댓글 수 로딩 중
[Open WebUI] 채팅 제목 조회 시 전체 대화 로드 대신 title 컬럼만 직접 쿼리get_chat_title_by_id에서 전체 ChatModel을 로드하던 것을 Chat.title 컬럼만 조회하도록 변경하여 DB 부하를 줄인 분석.#Open WebUI#Python#Performance#Database#SQLAlchemy2026년 2월 19일댓글 수 로딩 중
[Open WebUI] O(n²) 시간 복잡도 메시지 리스트 생성 버그 수정list.insert(0) 대신 append+reverse로 변경하여 대화 기록 구성의 O(n²) 병목을 O(n)으로 개선한 분석.#Open WebUI#Python#Performance#Algorithm#Time Complexity2026년 2월 19일댓글 수 로딩 중
[Triton] 모듈 언로드 테스트 비결정적 실패 수정 — GC 비활성화로 안정성 확보Python garbage collector가 테스트 중 module_unload callback을 예기치 않게 호출하는 비결정적 실패를 수정한다#Triton#Python#Testing#Garbage Collection#Bug Fix2026년 2월 19일댓글 수 로딩 중
[Open WebUI] 공유 채팅 목록에서 불필요한 JSON 역직렬화를 제거하여 응답 속도 개선전체 Chat 행을 로드하던 공유 채팅 목록 API를 컬럼 프로젝션으로 전환하여, 대용량 대화 JSON 역직렬화를 완전히 제거한 최적화 분석.#Open WebUI#Python#Performance#SQLAlchemy#Database2026년 2월 19일댓글 수 로딩 중
[Grafana Loki] 검증이 완료될 때까지 accepted stream 캐시를 비활성화확률적 자료구조인 블룸 필터 기반 캐시의 효과를 추가 검증하기 위해 기본값을 비활성으로 변경한 분석.#Grafana Loki#Go#Bloom Filter#Cache#Feature Flag#Reliability2026년 2월 19일댓글 수 로딩 중
[Grafana Loki] 범위 집계를 병렬 파티션으로 푸시다운하여 쿼리 처리 최적화결합법칙/교환법칙이 성립하는 집계 연산을 parallelPushdown 최적화에 적용하여, 네트워크 전송량 감소와 파이프라인 병목 해소를 동시에 달성한 분석.#Grafana Loki#Go#Performance#Query Optimization#Parallel Processing2026년 2월 19일댓글 수 로딩 중
[feast] Feast 성능 최적화: 엔티티 키 직렬화 Hot Path 2.4배 개선하기Feast의 온라인 스토어 성능을 좌우하는 엔티티 키 직렬화 로직을 Fast Path 도입과 memoryview 활용으로 최대 141% 개선한 사례를 분석합니다.#Python#Performance#Feast#Optimization#Zero-copy2026년 2월 19일댓글 수 로딩 중
[Feast] Feast 엔티티 키 직렬화 핫패스 최적화single-entity fast path와 memoryview zero-copy 슬라이싱으로 직렬화/역직렬화 성능을 개선#Feast#Feature Store#Serialization#Performance2026년 2월 19일댓글 수 로딩 중
[Ray RLlib] SingleAgentEnvRunner의 validate 호출 위치 최적화로 3.1배 속도 향상Ray RLlib의 SingleAgentEnvRunner에서 매 스텝마다 호출되던 validate를 에피소드 완료 시점으로 이동하여 add_step_data의 누적 시간을 16.7초에서 5.43초로 줄인 최적화를 분석합니다.#Ray#RLlib#Python#Performance#Reinforcement Learning#Optimization2026년 2월 19일댓글 수 로딩 중
[Ray Core] Memory Monitor의 OS별 조건부 컴파일 패턴 적용메모리 모니터를 인터페이스 분리 + OS별 빌드로 리팩토링하여 유지보수성과 확장성 개선.#Ray#C++#Performance#Memory Management#Architecture2026년 2월 18일댓글 수 로딩 중
[pydantic-ai] Temporal/DBOS MCP 서버에서 매번 도구 목록을 다시 가져오는 문제 수정Temporal과 DBOS의 MCP 래퍼에서 캐시된 도구 정의를 활용하여 불필요한 MCP 서버 왕복을 제거한 사례를 분석합니다.#pydantic-ai#MCP#DBOS#Temporal#Caching#Performance2026년 2월 19일댓글 수 로딩 중
[Ray] ExecutionCache 도입으로 데이터셋 캐싱 로직 통합 및 간소화산재된 스냅샷 변수들을 ExecutionCache 클래스로 통합하고, 반복 실행과 일반 실행의 캐시 검증을 일관되게 만든 분석.#Ray#Python#Refactoring#Cache#Performance#Data Pipeline2026년 2월 18일댓글 수 로딩 중
[Grafana Loki] 프론트엔드 캐시를 리팩터링하고 캐시된 스트림을 요청에서 필터링acceptedStreamsCache로 캐시를 분리하고, 이미 승인된 스트림을 요청에서 제거하여 백엔드 부하를 줄이며, 블룸 필터 메트릭을 추가한 분석.#Grafana Loki#Go#Performance#Bloom Filter#Cache#Metrics2026년 2월 18일댓글 수 로딩 중
[vllm] Decode Context Parallel - GPU Model Runner V2용 디코드 단계 컨텍스트 병렬화디코드 단계에서 긴 컨텍스트의 KV cache를 여러 GPU에 분산하여 메모리 효율과 throughput을 동시 개선#vllm#Performance2026년 2월 18일댓글 수 로딩 중
[llm-compressor] DataLoader 최적화와 Single-pass Weight CalibrationDataLoader 옵션 확장과 단일 패스 가중치 캘리브레이션으로 양자화 파이프라인 속도와 유연성 개선#llm-compressor#Performance2026년 2월 18일댓글 수 로딩 중
[triton] AMD GFX950에서 Padded Layout Async Copy의 OOM 버그 수정작은 타일 크기에서 padding interval이 contiguous 차원보다 큰 경우를 처리하여 pipelining 시 OOM을 방지한 사례를 분석합니다.#Triton#AMD#GPU#GFX950#Pipelining#BugFix2026년 2월 18일댓글 수 로딩 중
[Ray] memory_full_info 호출 제거로 ML 학습 성능 저하 문제 해결Ray에서 프로세스 메모리 모니터링 시 비용이 큰 memory_full_info 호출을 제거하고, memory_info로부터 USS를 근사 추정하여 ML 학습 중 성능 저하를 해결한 최적화를 분석합니다.#Ray#Python#Performance#Memory Monitoring#psutil#ML Training2026년 2월 18일댓글 수 로딩 중