[Ray] 외부 소비자의 Object Store 사용량을 Resource Manager 예산에 반영Iterator와 streaming_split의 프리페치가 보유한 블록을 executor sink 오퍼레이터에 귀속시켜, 리소스 매니저가 정확한 메모리 예산을 할당하도록 개선한 분석.#Ray#Python#Performance#Resource Management#Memory#Data Pipeline2026년 3월 31일댓글 수 로딩 중
[Loki] Helm 차트 Memcached CPU 리소스 오버라이드 지원 추가Grafana Loki Helm 차트의 자동 리소스 계산 모드에서 하드코딩된 500m CPU 대신, allocatedCPU 값으로 오버라이드할 수 있도록 개선한 변경 사항을 분석합니다.#Grafana Loki#Helm#Kubernetes#Memcached#Resource Management2026년 3월 10일댓글 수 로딩 중
[논문리뷰] Agents of Chaos이 논문은 영구 메모리, 이메일, Discord 접근 권한, 파일 시스템, 쉘 실행 능력을 갖춘 라이브 환경에 배포된 자율형 언어 모델 기반 에이전트 에 대한 탐색적 레드팀 연구를 보고합니다.#Review#AI Agents#Red-teaming#Agentic Systems#Multi-Agent Communication#Security Vulnerabilities#Prompt Injection#Social Engineering#Resource Management2026년 2월 23일댓글 수 로딩 중
[pydantic-ai] 클라이언트 연결 해제 시 StopAsyncIteration 방지를 위한 aclosing 적용_stream_text_deltas를 aclosing으로 감싸 클라이언트 중단 시 비동기 제너레이터가 올바르게 정리되도록 수정한 사례를 분석합니다.#pydantic-ai#asyncio#Streaming#Bug Fix#Resource Management2026년 2월 16일댓글 수 로딩 중
[Ray Data] 리소스 매니저 스케줄링에 논리적 메모리 포함Ray Data의 리소스 매니저가 CPU/GPU만 고려하던 스케줄링 결정에 논리적 메모리(memory)를 추가하여, 메모리 초과 할당을 방지하는 PR을 분석합니다.#Ray#Ray Data#Resource Management#Memory#Scheduling#Python2026년 2월 11일댓글 수 로딩 중
[논문리뷰] Learning Query-Aware Budget-Tier Routing for Runtime Agent Memory이 논문은 LLM 에이전트의 기존 오프라인, 쿼리-불가지론적 메모리 구성 방식이 비효율적이며 쿼리-중요 정보를 놓칠 수 있다는 문제를 제기합니다. 핵심 목표는 런타임 메모리 추출을 위해 명시적이고 제어 가능한 성능-비용 트레이드오프 를 가능하게 하는 프레임워크를 개발하는 것입니다.#Review#LLM Agents#Runtime Memory#Budget-Tier Routing#Reinforcement Learning#Performance-Cost Trade-off#Modular Memory Pipeline#Query-Aware Memory#Resource Management2026년 2월 9일댓글 수 로딩 중
[논문리뷰] MARS: Modular Agent with Reflective Search for Automated AI Research본 논문은 높은 평가 비용, 불투명한 성능 귀속, 복잡한 아키텍처 등으로 인해 기존 LLM 기반 에이전트가 어려움을 겪는 자동화된 AI 연구의 한계를 해결하는 것을 목표로 합니다. 특히, 컴퓨테이션 비용을 고려하고 모듈식 코드 생성을 통해 자율적인 AI 과학 발견을 최적화하는 프레임워크를 제시합니다.#Review#Autonomous AI#Agent Framework#Machine Learning Engineering#Monte Carlo Tree Search#Reflective Learning#Modular Programming#Code Generation#Resource Management2026년 2월 3일댓글 수 로딩 중
[논문리뷰] MegaFlow: Large-Scale Distributed Orchestration System for the Agentic Era본 논문은 인터랙티브하고 자율적인 AI 에이전트의 대규모 훈련 및 평가를 위한 기존 인프라의 한계를 해결하고자 합니다.#Review#Agentic AI#Distributed Orchestration#Scalability#Cloud-Native#Reinforcement Learning#Software Engineering Agents#Resource Management2026년 1월 12일댓글 수 로딩 중
[Ray Data] AutoscalingCoordinator에서 여러 데이터셋 실행 시 리소스 이중 할당 방지request_remaining=True인 요청자가 여러 개일 때 잔여 리소스를 모두에게 중복 할당하던 문제를 균등 분배로 수정한 분석.#Ray#Python#Bug Fix#Autoscaling#Resource Management2025년 12월 31일댓글 수 로딩 중
[논문리뷰] Janus: Disaggregating Attention and Experts for Scalable MoE Inference본 연구는 대규모 Mixture-of-Experts (MoE) 모델 추론 시 발생하는 높은 자원 요구량, 동적 워크로드, 그리고 어텐션 및 전문가 레이어 간의 이질적인 컴퓨팅 요구사항 문제를 해결하고자 합니다.#Review#MoE Inference#Disaggregated Architecture#Resource Management#Scalability#Load Balancing#GPU Utilization#Communication Optimization2025년 12월 16일댓글 수 로딩 중
[논문리뷰] Workload Schedulers -- Genesis, Algorithms and Differences본 논문은 현대의 워크로드 스케줄러를 운영체제 프로세스 스케줄러 , 클러스터 시스템 잡 스케줄러 , 빅 데이터 스케줄러 의 세 가지 범주로 분류하고, 각 클래스의 진화 과정, 사용되는 알고리즘, 주요 특징 및 차이점을 분석하는 것을 목표로 합니다.#Review#Workload Scheduling#Process Scheduling#Job Scheduling#Big Data Processing#Resource Management#Distributed Systems#Scheduling Algorithms#Performance Optimization2025년 11월 16일댓글 수 로딩 중
[논문리뷰] A Meta-Heuristic Load Balancer for Cloud Computing Systems클라우드 시스템에서 노드 과부하를 방지하고 시스템 안정성을 유지하며 최소 비용으로 서비스를 할당하는 전략을 개발하는 것이 목표입니다. 특히, 다양한 유형의 자원 활용 및 서비스 마이그레이션 비용을 고려한 추상적인 클라우드 자원 모델을 제시하고 이를 효율적으로 관리할 로드 밸런서의 성능을 평가하고자 합니다.#Review#Cloud Computing#Load Balancing#Meta-Heuristic#Genetic Algorithm#Simulated Annealing#Tabu Search#Resource Management#Service Migration2025년 11월 16일댓글 수 로딩 중
[논문리뷰] Taming the Chaos: Coordinated Autoscaling for Heterogeneous and Disaggregated LLM Inference전통적인 자동 스케일러가 Prefill-Decode (P/D) 분리형 아키텍처 를 사용하는 대규모 언어 모델(LLM) 추론 환경에서 비효율적이라는 문제에 직면했습니다. 이로 인해 이기종 하드웨어의 비효율적인 사용, 네트워크 병목 현상, 그리고 Prefill 및 Decode 단계 간의 불균형이 발생합니다.#Review#LLM Inference#Autoscaling#Disaggregated Architecture#Heterogeneous Hardware#Resource Management#Topology-aware Scheduling#GPU Utilization2025년 8월 28일댓글 수 로딩 중
[논문리뷰] Efficient Agents: Building Effective Agents While Reducing Cost본 논문은 대규모 언어 모델(LLM) 기반 에이전트 시스템의 확장성과 접근성을 위협하는 급증하는 비용 문제 를 해결하고자 합니다.#Review#LLM Agents#Cost Efficiency#Performance-Cost Trade-off#Agent Frameworks#GAIA Benchmark#Optimization#Resource Management2025년 8월 7일댓글 수 로딩 중
[Ray] OpResourceAllocator 리팩토링으로 데이터 흐름 명시화Ray Data의 리소스 할당 시스템인 OpResourceAllocator를 리팩토링하여, API에서 데이터 흐름을 명시적으로 표현하고 디버깅을 위한 progress bar 정보를 강화한 변경 사항을 분석합니다.#Ray#Python#Refactoring#Resource Management#Data Pipeline#Architecture2025년 10월 27일댓글 수 로딩 중