#Prompt Optimization

14개의 포스트

[논문리뷰] When Gradients Collide: Failure Modes of Multi-Objective Prompt Optimization for LLM Judges

본 논문은 여러 평가 기준을 동시에 고려해야 하는 Multi-Objective LLM Judge의 프롬프트 최적화 과정에서 발생하는 근본적인 문제들을 규명한다.

#Review #LLM-as-a-Judge #Prompt Optimization #Textual Gradient #Multi-Objective Optimization #Gradient Dilution #Instruction Interference

2026년 6월 7일

[논문리뷰] SePO: Self-Evolving Prompt Agent for System Prompt Optimization

본 논문은 기존 시스템 프롬프트 최적화 방식이 갖는 불완전한 최적화 루프 문제를 해결하고자 합니다.

#Review #Prompt Optimization #Self-Evolving Agents #Evolutionary Search #System Prompt #Meta-Learning #Cross-Task Generalization

2026년 6월 4일

[논문리뷰] MemTrace: Tracing and Attributing Errors in Large Language Model Memory Systems

본 논문은 LLM 메모리 시스템에서 발생하는 복잡한 오류의 근본 원인을 파악하고 추적하기 위한 자동화된 프레임워크가 부재하다는 문제를 해결합니다.

#Review #LLM Memory Systems #Failure Attribution #Execution Graphs #MemTraceBench #Automatic Debugging #Prompt Optimization

2026년 5월 27일

[논문리뷰] REVERE: Reflective Evolving Research Engineer for Scientific Workflows

기존의 Prompt-Optimization Techniques는 주로 Local Signals에 의존하여 Behavior를 업데이트하며, 이로 인해 Generalization이 저하되고 Full-Prompt Rewrites나 Unstructured Merges 과정에서 Knowledge Loss가 발생합니다.

#Review #LLM Agents #Self-Adaptation #Research-Coding Workflows #Prompt Optimization #Global Training Context #Code-Based Edits #Continual Learning #Semantic Drift

2026년 3월 23일

[논문리뷰] Adaptive Text Anonymization: Learning Privacy-Utility Trade-offs via Prompt Optimization

본 논문은 기존 텍스트 익명화 방법론들이 수동적이고 정적이며 다양한 도메인과 프라이버시-유틸리티 요구사항에 유연하게 대응하지 못하는 한계를 해결하고자 합니다. 이를 위해 익명화 전략을 특정 프라이버시-유틸리티 요구사항에 맞춰 자동으로 조정하는 적응형 텍스트 익명화 라는 새로운 태스크를 제안합니다.

#Review #Text Anonymization #Large Language Models #Prompt Optimization #Privacy-Utility Trade-offs #Evolutionary Algorithms #Multi-objective Optimization #Data Privacy

2026년 2월 24일

[논문리뷰] Visual Persuasion: What Influences Decisions of Vision-Language Models?

본 연구는 Vision-Language Model (VLM) 이 시각적 요인에 의해 의사결정에 어떻게 영향을 받는지 체계적으로 이해하는 것을 목표로 합니다.

#Review #Vision-Language Models #Visual Persuasion #Prompt Optimization #Image Generation #AI Agent Behavior #Interpretability #Behavioral Evaluation

2026년 2월 17일

[논문리뷰] Guidelines to Prompt Large Language Models for Code Generation: An Empirical Characterization

본 연구는 LLM 기반 코드 생성 시 개발자들이 효과적인 프롬프트를 작성할 수 있도록 돕는 구체적인 가이드라인이 부족하다는 문제점을 해결하고자 합니다.

#Review #Large Language Models #Code Generation #Prompt Engineering #Prompt Optimization #Empirical Study #Software Engineering #Guidelines

2026년 1월 25일

[논문리뷰] SCOPE: Prompt Evolution for Enhancing Agent Effectiveness

대규모 언어 모델(LLM) 에이전트가 방대한 동적 컨텍스트에 직면했을 때 정적인 프롬프트로 인해 발생하는 '수정(Corrective)' 및 '강화(Enhancement)' 실패 를 해결하는 것을 목표로 합니다.

#Review #LLM Agents #Prompt Optimization #Context Management #Online Learning #Agent Effectiveness #Self-Evolving Prompts #Trace-Based Learning #Dual-Stream Routing

2025년 12월 17일

[논문리뷰] PromptBridge: Cross-Model Prompt Transfer for Large Language Models

본 논문은 LLM 시스템에서 모델이 교체되거나 업데이트될 때, 기존 모델에 최적화된 프롬프트의 성능이 다른 모델에서 크게 저하되는 현상인 모델 드리프팅(Model Drifting) 문제를 해결하고자 합니다.

#Review #Large Language Models #Prompt Engineering #Model Drifting #Prompt Transfer #Cross-Model Adaptation #Training-Free #Prompt Optimization #MAP-RPE

2025년 12월 1일

[논문리뷰] TiViBench: Benchmarking Think-in-Video Reasoning for Video Generative Models

본 논문은 기존의 이미지-투-비디오(I2V) 생성 모델 평가 벤치마크가 시각적 충실도와 시간적 일관성에 집중하여 고차원적인 추론 능력을 제대로 평가하지 못하는 문제를 해결하고자 합니다.

#Review #Video Generative Models #Visual Reasoning #Benchmarking #Image-to-Video #TiViBench #VideoTPO #Prompt Optimization

2025년 11월 17일

[논문리뷰] Multimodal Prompt Optimization: Why Not Leverage Multiple Modalities for MLLMs

본 논문은 기존 프롬프트 최적화 방법론이 텍스트 모달리티에만 국한되어 Multimodal Large Language Models (MLLMs) 의 잠재력을 완전히 활용하지 못하는 한계를 해결하고자 합니다.

#Review #Multimodal AI #Prompt Optimization #MLLMs #Bayesian Optimization #Cross-modal Alignment #Prompt Engineering #Generative AI #Exploration-Exploitation

2025년 10월 13일

[논문리뷰] RAPO++: Cross-Stage Prompt Optimization for Text-to-Video Generation via Data Alignment and Test-Time Scaling

본 논문은 사용자 제공 프롬프트가 짧고 구조화되지 않으며 훈련 데이터와 불일치하여 확산 기반 T2V 모델 의 생성 잠재력을 제한하는 문제를 해결합니다. 생성 백본 모델을 수정하지 않으면서 T2V 생성 품질 을 대폭 향상시키기 위한 프롬프트 최적화 프레임워크를 제안하는 것을 목표로 합니다.

#Review #Text-to-Video Generation #Prompt Optimization #Large Language Models (LLM)#Test-Time Scaling #Retrieval-Augmented Generation #Diffusion Models #Data Alignment

2025년 10월 27일

[논문리뷰] VISTA: A Test-Time Self-Improving Video Generation Agent

본 논문은 텍스트-투-비디오(T2V) 생성 모델이 사용자 프롬프트에 매우 민감 하여 고품질 비디오를 얻기 위한 반복적인 프롬프트 수정과 필터링이 필요하다는 문제를 해결하고자 합니다.

#Review #Text-to-Video Generation #Prompt Optimization #Multi-Agent System #Test-Time Improvement #MLLM-as-a-Judge #Video Evaluation #Audio-Video Synthesis

2025년 10월 20일

[논문리뷰] ACON: Optimizing Context Compression for Long-horizon LLM Agents

본 논문은 장기(long-horizon) LLM 에이전트 태스크 에서 발생하는 컨텍스트 길이 증가 문제 를 해결하고자 합니다. 상호작용 기록 및 환경 관찰을 최적으로 압축하여, 추론 비용 과 메모리 사용량 을 줄이면서도 에이전트의 태스크 성능 을 유지하거나 향상시키는 통합 프레임워크를 제안하는 것을 목표로 합니다.

#Review #LLM Agents #Context Compression #Long-horizon Tasks #Prompt Optimization #Knowledge Distillation #Memory Efficiency #Task Performance #Failure Analysis

2025년 10월 2일