#Resource Management

15개의 포스트

[Ray] 외부 소비자의 Object Store 사용량을 Resource Manager 예산에 반영

Iterator와 streaming_split의 프리페치가 보유한 블록을 executor sink 오퍼레이터에 귀속시켜, 리소스 매니저가 정확한 메모리 예산을 할당하도록 개선한 분석.

#Ray #Python #Performance #Resource Management #Memory #Data Pipeline

2026년 3월 31일

[Loki] Helm 차트 Memcached CPU 리소스 오버라이드 지원 추가

Grafana Loki Helm 차트의 자동 리소스 계산 모드에서 하드코딩된 500m CPU 대신, allocatedCPU 값으로 오버라이드할 수 있도록 개선한 변경 사항을 분석합니다.

#Grafana Loki #Helm #Kubernetes #Memcached #Resource Management

2026년 3월 10일

[논문리뷰] Agents of Chaos

이 논문은 영구 메모리, 이메일, Discord 접근 권한, 파일 시스템, 쉘 실행 능력을 갖춘 라이브 환경에 배포된 자율형 언어 모델 기반 에이전트 에 대한 탐색적 레드팀 연구를 보고합니다.

#Review #AI Agents #Red-teaming #Agentic Systems #Multi-Agent Communication #Security Vulnerabilities #Prompt Injection #Social Engineering #Resource Management

2026년 2월 23일

[pydantic-ai] 클라이언트 연결 해제 시 StopAsyncIteration 방지를 위한 aclosing 적용

_stream_text_deltas를 aclosing으로 감싸 클라이언트 중단 시 비동기 제너레이터가 올바르게 정리되도록 수정한 사례를 분석합니다.

#pydantic-ai #asyncio #Streaming #Bug Fix #Resource Management

2026년 2월 16일

[Ray Data] 리소스 매니저 스케줄링에 논리적 메모리 포함

Ray Data의 리소스 매니저가 CPU/GPU만 고려하던 스케줄링 결정에 논리적 메모리(memory)를 추가하여, 메모리 초과 할당을 방지하는 PR을 분석합니다.

#Ray #Ray Data #Resource Management #Memory #Scheduling #Python

2026년 2월 11일

[논문리뷰] Learning Query-Aware Budget-Tier Routing for Runtime Agent Memory

이 논문은 LLM 에이전트의 기존 오프라인, 쿼리-불가지론적 메모리 구성 방식이 비효율적이며 쿼리-중요 정보를 놓칠 수 있다는 문제를 제기합니다. 핵심 목표는 런타임 메모리 추출을 위해 명시적이고 제어 가능한 성능-비용 트레이드오프 를 가능하게 하는 프레임워크를 개발하는 것입니다.

#Review #LLM Agents #Runtime Memory #Budget-Tier Routing #Reinforcement Learning #Performance-Cost Trade-off #Modular Memory Pipeline #Query-Aware Memory #Resource Management

2026년 2월 9일

[논문리뷰] MARS: Modular Agent with Reflective Search for Automated AI Research

본 논문은 높은 평가 비용, 불투명한 성능 귀속, 복잡한 아키텍처 등으로 인해 기존 LLM 기반 에이전트가 어려움을 겪는 자동화된 AI 연구의 한계를 해결하는 것을 목표로 합니다. 특히, 컴퓨테이션 비용을 고려하고 모듈식 코드 생성을 통해 자율적인 AI 과학 발견을 최적화하는 프레임워크를 제시합니다.

#Review #Autonomous AI #Agent Framework #Machine Learning Engineering #Monte Carlo Tree Search #Reflective Learning #Modular Programming #Code Generation #Resource Management

2026년 2월 3일

[논문리뷰] MegaFlow: Large-Scale Distributed Orchestration System for the Agentic Era

본 논문은 인터랙티브하고 자율적인 AI 에이전트의 대규모 훈련 및 평가를 위한 기존 인프라의 한계를 해결하고자 합니다.

#Review #Agentic AI #Distributed Orchestration #Scalability #Cloud-Native #Reinforcement Learning #Software Engineering Agents #Resource Management

2026년 1월 12일

[Ray Data] AutoscalingCoordinator에서 여러 데이터셋 실행 시 리소스 이중 할당 방지

request_remaining=True인 요청자가 여러 개일 때 잔여 리소스를 모두에게 중복 할당하던 문제를 균등 분배로 수정한 분석.

#Ray #Python #Bug Fix #Autoscaling #Resource Management

2025년 12월 31일

[논문리뷰] Janus: Disaggregating Attention and Experts for Scalable MoE Inference

본 연구는 대규모 Mixture-of-Experts (MoE) 모델 추론 시 발생하는 높은 자원 요구량, 동적 워크로드, 그리고 어텐션 및 전문가 레이어 간의 이질적인 컴퓨팅 요구사항 문제를 해결하고자 합니다.

#Review #MoE Inference #Disaggregated Architecture #Resource Management #Scalability #Load Balancing #GPU Utilization #Communication Optimization

2025년 12월 16일

[논문리뷰] Workload Schedulers -- Genesis, Algorithms and Differences

본 논문은 현대의 워크로드 스케줄러를 운영체제 프로세스 스케줄러 , 클러스터 시스템 잡 스케줄러 , 빅 데이터 스케줄러 의 세 가지 범주로 분류하고, 각 클래스의 진화 과정, 사용되는 알고리즘, 주요 특징 및 차이점을 분석하는 것을 목표로 합니다.

#Review #Workload Scheduling #Process Scheduling #Job Scheduling #Big Data Processing #Resource Management #Distributed Systems #Scheduling Algorithms #Performance Optimization

2025년 11월 16일

[논문리뷰] A Meta-Heuristic Load Balancer for Cloud Computing Systems

클라우드 시스템에서 노드 과부하를 방지하고 시스템 안정성을 유지하며 최소 비용으로 서비스를 할당하는 전략을 개발하는 것이 목표입니다. 특히, 다양한 유형의 자원 활용 및 서비스 마이그레이션 비용을 고려한 추상적인 클라우드 자원 모델을 제시하고 이를 효율적으로 관리할 로드 밸런서의 성능을 평가하고자 합니다.

#Review #Cloud Computing #Load Balancing #Meta-Heuristic #Genetic Algorithm #Simulated Annealing #Tabu Search #Resource Management #Service Migration

2025년 11월 16일

[논문리뷰] Taming the Chaos: Coordinated Autoscaling for Heterogeneous and Disaggregated LLM Inference

전통적인 자동 스케일러가 Prefill-Decode (P/D) 분리형 아키텍처 를 사용하는 대규모 언어 모델(LLM) 추론 환경에서 비효율적이라는 문제에 직면했습니다. 이로 인해 이기종 하드웨어의 비효율적인 사용, 네트워크 병목 현상, 그리고 Prefill 및 Decode 단계 간의 불균형이 발생합니다.

#Review #LLM Inference #Autoscaling #Disaggregated Architecture #Heterogeneous Hardware #Resource Management #Topology-aware Scheduling #GPU Utilization

2025년 8월 28일

[논문리뷰] Efficient Agents: Building Effective Agents While Reducing Cost

본 논문은 대규모 언어 모델(LLM) 기반 에이전트 시스템의 확장성과 접근성을 위협하는 급증하는 비용 문제 를 해결하고자 합니다.

#Review #LLM Agents #Cost Efficiency #Performance-Cost Trade-off #Agent Frameworks #GAIA Benchmark #Optimization #Resource Management

2025년 8월 7일

[Ray] OpResourceAllocator 리팩토링으로 데이터 흐름 명시화

Ray Data의 리소스 할당 시스템인 OpResourceAllocator를 리팩토링하여, API에서 데이터 흐름을 명시적으로 표현하고 디버깅을 위한 progress bar 정보를 강화한 변경 사항을 분석합니다.

#Ray #Python #Refactoring #Resource Management #Data Pipeline #Architecture

2025년 10월 27일