#Agentic LLM

6개의 포스트

[논문리뷰] LayerRoute: Input-Conditioned Adaptive Layer Skipping via LoRA Fine-Tuning for Agentic Language Models

본 논문은 에이전트 시스템에서 도구 호출과 계획 수립처럼 서로 다른 복잡도를 가진 작업이 수행됨에도 불구하고, 모든 단계에 동일한 연산량을 투입하는 비효율성을 해결하고자 합니다. 기존 LLM 추론 시스템은 고정된 transformer 레이어 구조를 사용하여 모든 토큰에 대해 동일한 컴퓨팅 비용을 소모합니다.

#Review #Layer Skipping #Agentic LLM #LoRA #Adaptive Inference #Straight-Through Estimator #Model Efficiency

2026년 6월 7일

[논문리뷰] MiroThinker-1.7 & H1: Towards Heavy-Duty Research Agents via Verification

최근 Large Language Models (LLMs)는 유창한 텍스트 생성 및 광범위한 질문 답변 능력에서 상당한 발전을 이루었지만, scientific analysis, financial reasoning, open-ended research와 같은 많은 real-world 문제들은 단순한 conversational ability를 넘어선다.

#Review #Research Agents #Long-Horizon Reasoning #Verification #Agentic LLM #Multi-Step Problem Solving #Reinforcement Learning

2026년 3월 17일

[논문리뷰] Learning When to Act or Refuse: Guarding Agentic Reasoning Models for Safe Multi-Step Tool Use

에이전트형 언어 모델(LLMs)의 다단계 도구 사용(multi-step tool use) 환경에서 발생하는 고유한 안전 문제를 해결하는 것이 목표입니다.

#Review #Agentic LLM #AI Safety #Multi-Step Tool Use #Reinforcement Learning #Preference-Based Learning #Safety Guardrails #Refusal Mechanism #Structured Reasoning

2026년 3월 3일

[논문리뷰] 'What Are You Doing?': Effects of Intermediate Feedback from Agentic LLM In-Car Assistants During Multi-Step Processing

본 논문은 LLM 기반 에이전트 어시스턴트 가 다단계 작업을 수행할 때 진행 상황과 추론을 어떻게 효과적으로 전달해야 하는지에 대한 문제를 다룹니다.

#Review #Agentic LLM #In-Car Assistants #Human-AI Interaction #Feedback Mechanisms #User Experience #Multi-Step Tasks #Automotive AI #Speech Interfaces

2026년 2월 19일

[논문리뷰] Tongyi DeepResearch Technical Report

본 논문은 장기적인 정보 탐색 및 심층 연구 태스크를 위해 설계된 에이전트형 대규모 언어 모델인 Tongyi DeepResearch 를 소개하고 오픈소스화하는 것을 목표로 합니다.

#Review #Agentic LLM #Deep Research #Information Seeking #Reinforcement Learning #Synthetic Data #Context Management #Tool Use #Open-source AI

2025년 10월 29일

[논문리뷰] DeepAnalyze: Agentic Large Language Models for Autonomous Data Science

본 논문은 원시 데이터부터 분석가 수준의 심층 연구 보고서에 이르는 완전히 자율적인 데이터 과학 을 달성하는 것을 목표로 합니다. 기존 워크플로우 기반 데이터 에이전트들이 사전 정의된 워크플로우에 의존하여 복잡한 데이터 과학 태스크와 다양한 정형 데이터 처리에서 한계를 보이는 문제를 해결하고자 합니다.

#Review #Autonomous Data Science #Agentic LLM #Curriculum Learning #Reinforcement Learning #Data Agents #End-to-end Data Science

2025년 10월 21일