#RAG

17개의 포스트

[논문리뷰] LLM-Enabled NWDAF: A Step Toward AI-Native 6G Network Intelligence

본 연구는 기존 오픈소스 5G 네트워크 환경에서 NWDAF의 기능적 한계와 비전문가 사용자를 위한 직관적인 관리 도구의 부재를 해결하고자 합니다.

#Review #NWDAF #5G Core Network #6G #LLM Interface #Intent-Based Networking #Open-Source Testbed #RAG

2026년 6월 17일

[논문리뷰] Hierarchical Abstract Tree for Cross-Document Retrieval-Augmented Generation

본 연구는 기존 Tree-RAG 방법론들이 단일 문서 내 단일 홉 질문에만 최적화되어 있어, 복잡한 교차 문서 multi-hop 질문 대응 및 corpus-level 확장에 한계가 있다는 점을 지적한다.

#Review #RAG #Tree-RAG #Hierarchical Abstract Tree #Multi-hop Retrieval #Multi-granular Retrieval

2026년 5월 4일

[논문리뷰] KV Packet: Recomputation-Free Context-Independent KV Caching for LLMs

본 논문은 RAG(Retrieval-Augmented Generation) 환경에서 빈번하게 발생하는 KV cache의 컨텍스트 의존성 및 그로 인한 추론 지연 문제를 해결하는 것을 목표로 합니다.

#Review #LLM #KV Cache #RAG #Recomputation-Free #Soft-token Adapter #Self-Supervised Distillation #Attention Dynamics

2026년 4월 16일

[논문리뷰] Strategic Navigation or Stochastic Search? How Agents and Humans Reason Over Document Collections

Multimodal Agent는 복잡한 문서 기반 워크플로우를 자동화하는 유망한 방향을 제시하지만, 이러한 Agent가 진정한 Strategic Reasoning 을 보여주는지, 아니면 단지 Stochastic Trial-and-error Search 에 의존하는지에 대한 근본적인 의문이 존재했습니다.

#Review #Multimodal Agents #Document QA #Agentic Reasoning #RAG #Benchmark #PDFs #Effort Calibration

2026년 3월 12일

[논문리뷰] Semantic Search over 9 Million Mathematical Theorems

본 논문은 기존 검색 도구가 논문 단위로만 작동하여 특정 수학적 정리, 보조 정리, 명제 검색이 어려운 문제를 해결하고자 합니다. 대규모 수학적 정리 코퍼스에 대한 시맨틱 검색 시스템 을 구축하여, 연구자와 AI 에이전트가 특정 수학적 지식을 효율적으로 찾을 수 있도록 지원하는 것을 목표로 합니다.

#Review #Semantic Search #Theorem Retrieval #LLMs #Dense Retrieval #Mathematical Information Retrieval #Vector Embeddings #Mathematical Dataset #RAG

2026년 2월 5일

[논문리뷰] SAGE: Benchmarking and Improving Retrieval for Deep Research Agents

본 논문은 심층 연구 에이전트 워크플로우에서 LLM 기반 검색기 가 얼마나 효과적으로 기여할 수 있는지 체계적으로 조사하는 것을 목표로 합니다.

#Review #Deep Research Agents #Scientific Literature Retrieval #LLM-based Retrievers #Benchmarking #Test-time Scaling #Information Retrieval #Query Decomposition #RAG

2026년 2월 5일

[논문리뷰] FABLE: Forest-Based Adaptive Bi-Path LLM-Enhanced Retrieval for Multi-Document Reasoning

본 논문은 장문 컨텍스트 LLM의 'lost-in-the-middle' 현상, 높은 계산 비용, 멀티 도큐먼트 추론 확장성 부족 문제를 해결하고, 기존 RAG 시스템의 의미론적 노이즈 및 구조화된 교차 문서 합성 한계를 극복하는 것을 목표로 합니다.

#Review #RAG #LLM-Enhanced Retrieval #Multi-Document Reasoning #Hierarchical Indexing #Bi-Path Retrieval #Adaptive Retrieval #Knowledge Organization #Context Window Optimization

2026년 1월 27일

[논문리뷰] Structured Episodic Event Memory

현재 LLM(Large Language Models)의 RAG (Retrieval-Augmented Generation) 가 겪는 산발적인 정보 검색 및 구조적 의존성 부족 문제를 해결하여, 자율 에이전트의 장기 기억(long-term memory) 성능과 추론 일관성(logical consistency) 을 향상시키는 것을 목표로 합니다.

#Review #LLMs #RAG #Episodic Memory #Graph Memory #Memory Architecture #Narrative Coherence #Long-term Reasoning #Event Frames

2026년 1월 12일

[논문리뷰] Lost in the Noise: How Reasoning Models Fail with Contextual Distractors

현재 AI 연구는 '정돈된' 벤치마크에 의존하지만, 실제 환경의 본질적인 노이즈를 반영하지 못해 에이전트 AI 시스템의 실제 성능을 오해하게 만듭니다.

#Review #Robustness #Contextual Distractors #RAG #Reasoning Models #Alignment #Tool Use #NoisyBench #Rationale-Aware Reward #Inverse Scaling

2026년 1월 12일

[Open WebUI] 외부 임베딩 API 호출을 병렬화하여 50배 성능 향상

순차적으로 배치 처리하던 외부 임베딩 요청을 asyncio.gather로 병렬 실행하고, 동기 함수를 async로 전환하여 대규모 문서 처리 속도를 극적으로 개선한 최적화.

#Open WebUI #Python #Performance #asyncio #Embeddings #RAG

2025년 11월 23일

[논문리뷰] Think-on-Graph 3.0: Efficient and Adaptive LLM Reasoning on Heterogeneous Graphs via Multi-Agent Dual-Evolving Context Retrieval

본 논문은 기존 그래프 기반 RAG 시스템이 직면한 정적 그래프 인덱스 구축의 한계 와 LLM 추출기의 성능 의존성 문제를 해결하는 것을 목표로 합니다.

#Review #RAG #LLM Reasoning #Knowledge Graphs #Multi-Agent Systems #Context Retrieval #Heterogeneous Graphs #Adaptive Learning #Dual-Evolution

2025년 9월 29일

[논문리뷰] BESPOKE: Benchmark for Search-Augmented Large Language Model Personalization via Diagnostic Feedback

본 논문은 검색 증강 대규모 언어 모델(LLMs)의 개인화 능력 평가에 대한 체계적인 벤치마크 부재 문제를 해결하고자 합니다. 사용자의 다양한 정보 요구와 선호하는 전달 방식을 LLM이 얼마나 효과적으로 반영하는지 진단하고 평가하기 위한 사실적이고 진단적인 벤치마크 인 BESPOKE 를 제안하는 것을 목표로 합니다.

#Review #Search-Augmented LLMs #Personalization #Benchmark #Diagnostic Feedback #User History #Evaluation Framework #RAG

2025년 9월 26일

[논문리뷰] PRELUDE: A Benchmark Designed to Require Global Comprehension and Reasoning over Long Contexts

이 논문은 기존 장문 컨텍스트 이해 벤치마크의 한계(기억력 의존, 얕은 추론, 전역적 의존성 부족 등)를 해결하고, 대규모 언어 모델(LLMs)의 전역적 이해(global comprehension) 및 심층 추론(deep reasoning) 능력을 엄격하게 평가하기 위한 새로운 벤치마크인 PRELUDE 를 제안합니다.

#Review #Long-Context Understanding #Reasoning Benchmark #LLMs Evaluation #Natural Language Processing #Global Comprehension #Fluid Intelligence #Prequel Entailment #RAG

2025년 8월 15일

[논문리뷰] SitEmb-v1.5: Improved Context-Aware Dense Retrieval for Semantic Association and Long Story Comprehension

본 논문은 장문 문서에 대한 RAG(Retrieval-Augmented Generation) 시스템에서 기존 임베딩 모델의 한계를 극복하는 것을 목표로 합니다.

#Review #Dense Retrieval #Context-Aware Embedding #RAG #Long Document Comprehension #Residual Learning #Semantic Association #Text Embedding

2025년 8월 5일

[논문리뷰] InfiMed-ORBIT: Aligning LLMs on Open-Ended Complex Tasks via Rubric-Based Incremental Training

본 논문은 보상 함수가 모호하고 주관적인 개방형 AI 태스크 , 특히 의료 상담 과 같은 고위험 시나리오에서 LLM의 성능 향상을 목표로 합니다.

#Review #LLMs #Reinforcement Learning #Rubric-Based Training #Medical Dialogue #Open-Ended Tasks #HealthBench #RAG

2025년 10월 20일

[논문리뷰] Fantastic (small) Retrievers and How to Train Them: mxbai-edge-colbert-v0 Tech Report

본 연구는 클라우드부터 엣지 기기까지 모든 스케일에서 정보 검색을 지원하기 위해, 현대적인 아키텍처와 높은 효율성을 갖춘 소형 ColBERT 모델(mxbai-edge-colbert-v0) 을 개발하는 것을 목표로 합니다.

#Review #ColBERT #Retrieval Models #Small Models #Distillation #Long Context #Edge AI #Information Retrieval #RAG

2025년 10월 17일

[논문리뷰] Mem-α: Learning Memory Construction via Reinforcement Learning

대규모 언어 모델(LLM) 에이전트의 제한된 컨텍스트 윈도우 문제를 해결하기 위해, 기존의 외부 메모리 시스템이 사전에 정의된 규칙에만 의존하여 메모리 구축이 최적화되지 못하는 한계를 극복하는 것이 목표입니다.

#Review #LLM Agents #External Memory #Reinforcement Learning #Memory Management #Long-Context Understanding #Tool Learning #RAG #Memory Architecture

2025년 10월 1일