#LLM Routing

4개의 포스트

[논문리뷰] RouteProfile: Elucidating the Design Space of LLM Profiles for Routing

본 논문은 LLM 라우팅 시스템에서 핵심적인 역할을 하는 LLM Profile 설계의 모호성을 해결하고 그 디자인 공간을 체계화하는 것을 목적으로 한다. 기존 연구들은 주로 라우터 메커니즘 개선에만 집중하여, 정작 모델의 역량을 규정하는 프로파일 설계가 라우팅 성능에 미치는 영향은 간과해왔다 .

#Review #LLM Routing #LLM Profiling #Heterogeneous Graph #RouteProfile #Design Space #Cold-Start #Model Selection

2026년 5월 14일

[논문리뷰] SEAR: Schema-Based Evaluation and Routing for LLM Gateways

생성형 AI의 생산 환경 도입이 확산됨에 따라 다양한 모델과 제공자를 효율적으로 관리하고 라우팅하는 LLM gateway의 중요성이 커지고 있습니다. 그러나 기존의 평가 방식은 비정형 텍스트 기반이거나 단순한 점수 매기기에 그쳐, 복잡한 요청 상황에 대한 상세한 진단이나 운영 지표와의 결합이 어렵다는 한계가 있습니다.

#Review #LLM Gateways #LLM-as-judge #Structured LLM Outputs #Schema-conforming Generation #LLM Routing

2026년 3월 30일

[논문리뷰] SkillOrchestra: Learning to Route Agents via Skill Transfer

논문은 복합 AI 시스템에서 효과적인 오케스트레이션 문제를 해결하고자 합니다.

#Review #Agent Orchestration #Skill Transfer #LLM Routing #Performance-Cost Trade-off #Routing Collapse #Multi-turn Dialogue #Skill Handbook #Reinforcement Learning

2026년 2월 23일

[논문리뷰] Learning to Route LLMs from Bandit Feedback: One Policy, Many Trade-offs

대규모 LLM 배포 환경에서 각 쿼리당 최적의 LLM을 효율적으로 선택하는 문제를 해결하는 것이 목표입니다.

#Review #LLM Routing #Contextual Bandits #Bandit Feedback #Multi-objective Optimization #Preference-tuning #Policy Gradient #Cost-efficiency

2025년 10월 10일