#Training-Free

44개의 포스트

[논문리뷰] Off-the-Shelf LLMs as Process Scorers: Training-Free Alternative to PRMs for Mathematical Reasoning

본 연구는 대형 모델의 추론 성능을 소형 모델에서 효율적으로 모사하기 위한 기존 추론 기법들의 한계를 해결하고자 합니다.

#Review #Mathematical Reasoning #Large Language Models #Process Reward Model #Inference-time Guidance #Chunk-Level Generation #Likelihood Scoring #Training-Free

2026년 6월 1일

[논문리뷰] LVSA: Training-Free Sparse Attention for Long Video Diffusion

본 논문은 video diffusion transformers의 긴 영상 생성 과정에서 발생하는 dense self-attention의 연산 효율성 저하와 품질 저하 문제를 해결합니다.

#Review #Video Diffusion Transformers #Sparse Attention #Long Video Generation #Training-Free #FlashInfer #Attention Optimization

2026년 6월 1일

[논문리뷰] NGM: A Plug-and-Play Training-Free Memory Module for LLMs

본 논문은 LLM이 추론 시 고유한 로컬 패턴(식별자, 전문 용어, 구문 등)을 재구성하기 위해 과도한 연산 자원을 소모하는 문제를 해결하고자 합니다. 기존의 Conditional Memory 접근법은 학습이 필요한 메모리 테이블이나 별도의 저장소 인프라를 요구하여 유연성과 효율성을 제한합니다.

#Review #Large Language Models #Memory Module #N-gram #Training-Free #Plug-and-Play #Cosine Similarity

2026년 5월 18일

[논문리뷰] Darwin Family: MRI-Trust-Weighted Evolutionary Merging for Training-Free Scaling of Language-Model Reasoning

본 논문은 대규모 LLM의 추론 성능 향상을 위한 고비용의 post-training(instruction tuning, RL 등) 과정을 배제하고, 기존 Checkpoint 내에 잠재된 능력을 재조합하는 비용 효율적인 대안을 제시합니다.

#Review #Model Merging #Evolutionary Optimization #Large Language Models #Reasoning #Diagnostic-Guided #Training-Free

2026년 5월 14일

[논문리뷰] FlowSlider: Training-Free Continuous Image Editing via Fidelity-Steering Decomposition

본 논문은 Rectified Flow 기반 이미지 편집에서 학습 없이(training-free) 편집 강도를 안정적으로 조절할 수 있는 슬라이더 메커니즘 부재 문제를 해결합니다. 기존의 학습 기반 슬라이더 기법들은 추가적인 데이터와 학습 비용이 발생하며, 특정 도메인 분포에 의존적이라는 한계가 있습니다.

#Review #Rectified Flow #Image Editing #Training-Free #Slider Control #Fidelity-Steering Decomposition

2026년 4월 2일

[논문리뷰] S2D2: Fast Decoding for Diffusion LLMs via Training-Free Self-Speculation

최근 언어 모델링 분야에서 큰 발전을 이끈 Autoregressive (AR) 모델들은 엄격한 좌-우향 생성 방식 때문에 디코딩 유연성과 추론 병렬성에서 한계를 가진다.

#Review #Diffusion LLMs #Self-Speculation #Training-Free #Block-Diffusion #Fast Decoding #Rejection Sampling #Routing Policies

2026년 3월 26일

[논문리뷰] Versatile Editing of Video Content, Actions, and Dynamics without Training

최근 generative video models의 발전에도 불구하고, 실제 비디오에서 액션이나 dynamic event를 편집하거나, 삽입된 content가 다른 객체의 행동에 영향을 미치도록 하는 non-rigid, dynamic manipulation은 여전히 큰 도전 과제입니다.

#Review #Video Editing #Training-Free #Inversion-Free #Rectified Flow Models #Similarity Guided Aggregation (SGA)#Annealed Noise Correlation (ANC)#Text-to-Video Flow Models #Dynamic Manipulation

2026년 3월 22일

[논문리뷰] BEAVER: A Training-Free Hierarchical Prompt Compression Method via Structure-Aware Page Selection

최근 LLMs의 context window가 기하급수적으로 확장되면서 long-document understanding의 잠재력이 커졌지만, 이는 심각한 inference latency와 정보 utilization 병목 현상을 야기했습니다.

#Review #Prompt Compression #Long-Context LLMs #Training-Free #Hierarchical Selection #Structure-Aware #Inference Latency #Information Utilization

2026년 3월 22일

[논문리뷰] Just-in-Time: Training-Free Spatial Acceleration for Diffusion Transformers

Diffusion Transformers(DiT)의 높은 계산 비용, 특히 공간적 중복성으로 인한 실용적 배포의 어려움을 해결하는 것이 주요 목표입니다.

#Review #Diffusion Transformers #Spatial Acceleration #Training-Free #Generative AI #Flow Matching #ODE Solvers #Inference Speedup #Resource Allocation

2026년 3월 11일

[논문리뷰] Spilled Energy in Large Language Models

본 논문은 대규모 언어 모델(LLM)에서 발생하는 환각(hallucination) 을 추가적인 훈련 없이 효과적으로 탐지하는 것을 목표로 합니다.

#Review #LLM Hallucination Detection #Energy-Based Models #Training-Free #Logit Analysis #Spilled Energy #Cross-Task Generalization #Autoregressive Models

2026년 3월 3일

[논문리뷰] NoLan: Mitigating Object Hallucinations in Large Vision-Language Models via Dynamic Suppression of Language Priors

본 논문은 Large Vision-Language Models (LVLMs) 에서 출력 이미지에 존재하지 않는 객체를 생성하는 객체 환각(Object Hallucinations) 문제를 해결하는 것을 목표로 합니다.

#Review #Large Vision-Language Models (LVLMs)#Object Hallucinations #Language Priors #Contrastive Decoding #Dynamic Suppression #Training-Free #Multimodal AI

2026년 2월 25일

[논문리뷰] ScalSelect: Scalable Training-Free Multimodal Data Selection for Efficient Visual Instruction Tuning

본 연구는 대규모 Visual Instruction Tuning (VIT) 데이터셋의 높은 중복성으로 인한 비효율적인 훈련 비용 문제를 해결하고자 합니다.

#Review #Multimodal Data Selection #Visual Instruction Tuning #Training-Free #Scalability #Subspace Learning #Vision-Language Models #Attention Mechanism

2026년 2월 12일

[논문리뷰] ROCKET: Rapid Optimization via Calibration-guided Knapsack Enhanced Truncation for Efficient Model Compression

ROCKET 논문은 대규모 언어 모델(LLMs)의 과도한 크기로 인한 연산 및 메모리 요구 사항을 해결하기 위해 빠르고 훈련 없는(training-free) 모델 압축 방법을 개발하는 것을 목표로 합니다.

#Review #Model Compression #LLM #Training-Free #Knapsack Problem #Sparse Matrix Factorization #Dictionary Learning #Post-Training Optimization #Weight Sparsification

2026년 2월 11일

[논문리뷰] ASA: Training-Free Representation Engineering for Tool-Calling Agents

본 논문은 진화하는 인터페이스, 스키마 변화 및 엄격한 파서 조건 하에서 LLM 에이전트의 도구 호출 기능이 취약한 문제를 해결하고자 합니다.

#Review #Tool-Calling Agents #LLM Adaptation #Representation Engineering #Activation Steering #Training-Free #Inference-Time Control #Domain Adaptation

2026년 2월 11일

[논문리뷰] FASA: Frequency-aware Sparse Attention

대규모 언어 모델(LLMs)이 긴 입력 시퀀스를 처리할 때 발생하는 KV 캐시의 막대한 메모리 사용량과 연산 병목 현상 을 해결하는 것이 목표입니다.

#Review #Sparse Attention #KV Cache Optimization #Rotary Positional Embedding (RoPE)#Frequency Chunks (FCs)#LLMs #Long-Context #Training-Free

2026년 2월 4일

[논문리뷰] Scalable Power Sampling: Unlocking Efficient, Training-Free Reasoning for LLMs via Distribution Sharpening

본 논문의 핵심 목표는 LLM의 추론 성능을 향상시키는 데 사용되는 강화 학습(RL) 기반 후처리 및 MCMC(Markov Chain Monte Carlo) 기반 파워 샘플링 의 높은 계산 비용 문제를 해결하는 것입니다.

#Review #LLM Reasoning #Distribution Sharpening #Power Sampling #Training-Free #Monte Carlo Estimation #Jackknife Correction #Autoregressive Generation #Inference Efficiency

2026년 1월 29일

[논문리뷰] MAD: Modality-Adaptive Decoding for Mitigating Cross-Modal Hallucinations in Multimodal Large Language Models

본 논문은 Multimodal Large Language Models (MLLMs) 에서 발생하는 교차 모달리티 환각 현상(cross-modal hallucinations) 을 해결하는 것을 목표로 합니다.

#Review #Multimodal LLM #Cross-modal Hallucination #Contrastive Decoding #Modality-Adaptive Decoding #Self-Assessment #Audio-Visual Language Model #Training-Free

2026년 1월 29일

[논문리뷰] OpenVoxel: Training-Free Grouping and Captioning Voxels for Open-Vocabulary 3D Scene Understanding

기존 3D 장면 이해 방법론들이 훈련된 임베딩과 대규모 수동 주석, 긴 훈련 시간에 의존하는 한계를 극복하고자 합니다. OpenVoxel은 훈련 없이 희소 복셀을 그룹화하고 캡셔닝하여 오픈-vocabulary 3D 장면 이해 태스크를 수행하며, 특히 복잡한 자연어 질의에 효과적으로 대응하는 것을 목표로 합니다.

#Review #3D Scene Understanding #Open-Vocabulary Segmentation #Referring Expression Segmentation #Training-Free #Voxel Grouping #Vision-Language Models #Multi-modal Large Language Models #Sparse Voxel Rasterization

2026년 1월 14일

[논문리뷰] SpotEdit: Selective Region Editing in Diffusion Transformers

본 논문은 기존 Diffusion Transformer 기반 이미지 편집 모델들이 변경되지 않은 영역까지 포함하여 전체 이미지를 일관적으로 처리하고 디노이징하는 방식의 비효율성과 품질 저하 문제를 해결하는 것을 목표로 합니다.

#Review #Diffusion Transformer #Image Editing #Selective Editing #Computational Efficiency #Training-Free #Region-Aware #Perceptual Similarity

2025년 12월 29일

[논문리뷰] SpaceControl: Introducing Test-Time Spatial Control to 3D Generative Modeling

본 연구는 3D 에셋 생성에서 직관적이고 정밀한 기하학적 제어가 부족하다는 문제에 주목합니다.

#Review #3D Generative Models #Spatial Control #Test-Time Guidance #Rectified Flow #Superquadrics #Training-Free #Trellis

2025년 12월 7일

[논문리뷰] PromptBridge: Cross-Model Prompt Transfer for Large Language Models

본 논문은 LLM 시스템에서 모델이 교체되거나 업데이트될 때, 기존 모델에 최적화된 프롬프트의 성능이 다른 모델에서 크게 저하되는 현상인 모델 드리프팅(Model Drifting) 문제를 해결하고자 합니다.

#Review #Large Language Models #Prompt Engineering #Model Drifting #Prompt Transfer #Cross-Model Adaptation #Training-Free #Prompt Optimization #MAP-RPE

2025년 12월 1일

[논문리뷰] Latent Collaboration in Multi-Agent Systems

본 논문은 기존 대규모 언어 모델(LLM) 기반 다중 에이전트 시스템(MAS)이 텍스트 기반 추론 및 통신에 의존하여 발생하는 비효율성과 정보 손실 문제를 해결하는 것을 목표로 합니다.

#Review #Multi-Agent Systems #Large Language Models #Latent Space #Latent Reasoning #Latent Communication #KV Cache #Computational Efficiency #Training-Free

2025년 11월 26일

[논문리뷰] Block Cascading: Training Free Acceleration of Block-Causal Video Models

블록-인과(block-causal) 비디오 생성 모델, 특히 1.3B 모델 이 16 FPS , 14B 모델 이 4.5 FPS 에 불과한 느린 추론 속도로 인해 품질-속도 간의 심각한 절충(trade-off) 문제에 직면합니다.

#Review #Video Generation #Diffusion Models #Block-Causal Models #Inference Acceleration #Multi-GPU Parallelism #Training-Free #KV Caching #Interactive AI

2025년 11월 26일

[논문리뷰] Diversity Has Always Been There in Your Visual Autoregressive Models

Visual Autoregressive (VAR) 모델이 겪는 다양성 붕괴(diversity collapse) 문제를 해결하고, 추가적인 훈련 없이 모델의 내재된 생성 다양성을 발현시키면서도 이미지 품질과 텍스트-이미지 정렬을 효과적으로 유지하는 것을 목표로 합니다.

#Review #Visual Autoregressive Models #Diversity Collapse #Generative Diversity #Soft-Suppression Regularization #Soft-Amplification Regularization #Training-Free #Image Generation #Singular Value Decomposition

2025년 11월 23일

[논문리뷰] HiGS: History-Guided Sampling for Plug-and-Play Enhancement of Diffusion Models

확산 모델이 적은 NFEs(Neural Function Evaluations) 또는 낮은 guidance scale에서 비현실적인 출력과 세부 정보 부족을 보이는 문제를 해결하고, 확산 샘플링의 품질과 효율성을 향상시키는 것을 목표로 합니다.

#Review #Diffusion Models #Sampling #Generative AI #Image Generation #Plug-and-Play #Training-Free #Guidance #Momentum-Based Methods

2025년 9월 29일

[논문리뷰] Does FLUX Already Know How to Perform Physically Plausible Image Composition?

본 연구는 복잡한 조명, 그림자, 물 반사 등 물리적으로 사실적인 이미지 합성 을 사전 훈련된 텍스트-투-이미지(T2I) 확산 모델 을 활용하여 훈련 없이 수행하는 것을 목표로 합니다. 기존 모델들이 가진 객체 포즈 고정, 부적절한 해상도 처리, 그리고 컨텍스트에 맞지 않는 조명 생성 등의 한계를 극복하고자 합니다.

#Review #Image Composition #Diffusion Models #Training-Free #Physically Plausible #FLUX #Adapter #Guidance #Benchmark

2025년 9월 26일

[논문리뷰] ContextFlow: Training-Free Video Object Editing via Adaptive Context Enrichment

훈련 없이 비디오 객체 편집(삽입, 교체, 삭제)을 수행할 때 발생하는 정확한 인버전 실패와 부적절한 특성 대체로 인한 문맥적 충돌 문제를 해결하고, 특히 Diffusion Transformer (DiT) 기반 모델 에서 고품질 및 시간적 일관성을 유지하는 비디오 객체 편집 프레임워크를 개발하는 것을 목표로 합니다.

#Review #Video Object Editing #Training-Free #Diffusion Transformers #Rectified Flow #Adaptive Context Enrichment #Guidance Responsiveness #Temporal Consistency #Image-to-Video

2025년 9월 23일

[논문리뷰] LazyDrag: Enabling Stable Drag-Based Editing on Multi-Modal Diffusion Transformers via Explicit Correspondence

본 논문은 드래그 기반 이미지 편집에서 Multi-Modal Diffusion Transformers (MM-DiTs) 의 불안정성을 해결하고, 기존 방식의 암묵적 점 매칭 및 Test-Time Optimization (TTO) 또는 약화된 인버전 강도 의존성으로 인한 한계를 극복하는 것을 목표로 합니다.

#Review #Image Editing #Diffusion Models #Multi-Modal Transformers #Drag-based Editing #Explicit Correspondence #Attention Control #Identity Preservation #Training-Free

2025년 9월 16일

[논문리뷰] Focusing by Contrastive Attention: Enhancing VLMs' Visual Reasoning

본 논문은 복잡한 시각 환경에서 Vision-Language Models (VLMs) 의 추론 성능이 저하되는 문제를 해결하고자 합니다.

#Review #Vision-Language Models (VLMs)#Visual Reasoning #Attention Mechanisms #Contrastive Learning #Noise Suppression #Visual Complexity #Training-Free

2025년 9월 9일

[논문리뷰] Diffusion Language Models Know the Answer Before Decoding

본 논문은 확산 언어 모델(DLM)의 주요 단점인 느린 추론 속도를 해결하는 것을 목표로 합니다.

#Review #Diffusion Language Models #DLM Acceleration #Early Answer Convergence #Early Commit Decoding #Confidence Gap #Inference Speedup #Training-Free

2025년 8월 28일

[논문리뷰] VoxHammer: Training-Free Precise and Coherent 3D Editing in Native 3D Space

본 논문은 기존 2D 이미지 기반의 3D 편집 방법론이 겪는 비일관성 및 비정밀성의 한계를 극복하고, 네이티브 3D 잠재 공간 에서 훈련 없이(training-free) 정밀하고 일관성 있는 3D 로컬 편집을 수행하는 것을 목표로 합니다.

#Review #3D Editing #Training-Free #Diffusion Models #Latent Space #3D Inversion #Contextual Feature Replacement #3D Consistency #Edit3D-Bench

2025년 8월 27일

[논문리뷰] Training-Free Text-Guided Color Editing with Multi-Modal Diffusion Transformer

본 논문은 텍스트 지시 기반의 이미지 및 비디오 색상 편집에서 물리적 일관성 을 유지하며 정교한 제어를 가능하게 하는 미해결 문제를 다룹니다. 기존의 훈련 불필요(training-free) 방법론들이 정확한 색상 제어와 시각적 불일치 문제를 겪는 한계를 극복하고자 합니다.

#Review #Text-Guided Editing #Color Editing #Diffusion Transformers #Training-Free #Multi-Modal AI #Attention Control #Image Manipulation

2025년 8월 20일

[논문리뷰] MedSAMix: A Training-Free Model Merging Approach for Medical Image Segmentation

의료 영상 분할 분야에서 SAM(Segment Anything Model) 기반의 미세 조정된 모델들이 특정 작업에서 불균형한 성능과 제한된 일반화 능력을 보이는 문제를 해결하고자 합니다.

#Review #Medical Image Segmentation #Model Merging #Training-Free #SAM #Generalization #Zero-Order Optimization #Bayesian Optimization

2025년 8월 20일

[논문리뷰] S^2-Guidance: Stochastic Self Guidance for Training-Free Enhancement of Diffusion Models

본 논문은 확산 모델에서 널리 사용되는 Classifier-free Guidance (CFG) 가 종종 의미론적 불일치와 낮은 품질의 결과물을 초래하는 문제를 해결하고자 합니다.

#Review #Diffusion Models #Classifier-free Guidance #Self-Guidance #Training-Free #Stochastic Block-Dropping #Generative Models #Text-to-Image

2025년 8월 19일

[논문리뷰] Story2Board: A Training-Free Approach for Expressive Storyboard Generation

논문은 자연어 프롬프트로부터 표현력이 풍부하고 시각적으로 일관된 스토리보드를 생성하는 훈련 불필요(training-free) 프레임워크인 Story2Board를 제시합니다.

#Review #Storyboard Generation #Text-to-Image #Diffusion Models #Training-Free #Character Consistency #Scene Diversity #Visual Storytelling

2025년 8월 14일

[논문리뷰] UNCAGE: Contrastive Attention Guidance for Masked Generative Transformers in Text-to-Image Generation

본 논문은 Masked Generative Transformers (MGTs)를 사용한 텍스트-이미지(T2I) 생성 시 발생하는 조합적 충실도(compositional fidelity) 문제를 해결하고, 특히 속성 바인딩(attribute binding) 오류를 개선하는 것을 목표로 합니다.

#Review #Text-to-Image Generation #Masked Generative Transformers #Compositional Generation #Attention Guidance #Unmasking Strategy #Contrastive Learning #Training-Free #Attribute Binding

2025년 8월 13일

[논문리뷰] Less Is More: Training-Free Sparse Attention with Global Locality for Efficient Reasoning

본 논문은 대규모 추론 모델(LRMs)의 긴 토큰 생성 과정에서 발생하는 막대한 계산 오버헤드를 해결하는 것을 목표로 합니다.

#Review #Sparse Attention #LLMs #Reasoning Tasks #Efficiency #Training-Free #Global Locality #KV Cache Optimization

2025년 8월 12일

[논문리뷰] LAMIC: Layout-Aware Multi-Image Composition via Scalability of Multimodal Diffusion Transformer

본 논문은 여러 시각적 레퍼런스와 공간적 레이아웃 정보를 활용하여 일관되고 응집력 있는 이미지를 생성하는 것을 목표로 합니다. 특히, 기존 단일 레퍼런스 확산 모델을 훈련 없이 다중 레퍼런스 시나리오로 확장하고, 개체 일관성 및 정밀한 레이아웃 제어를 동시에 달성하는 문제를 해결하고자 합니다.

#Review #Multi-Image Composition #Layout Control #Diffusion Models #Transformer #Attention Mechanisms #Training-Free #Zero-Shot Generalization

2025년 8월 6일

[논문리뷰] LightCache: Memory-Efficient, Training-Free Acceleration for Video Generation

본 논문은 확산 모델 기반 비디오 생성 과정에서 발생하는 높은 GPU 메모리 사용량 과 긴 추론 시간 문제를 해결하고자 합니다. 특히 기존 캐싱 기반 가속화 방법이 야기하는 메모리 급증 현상 을 극복하고, 모델 훈련 없이 메모리 효율적인 가속화를 달성하여 실제 환경 배포의 제약을 완화하는 것을 목표로 합니다.

#Review #Video Generation #Diffusion Models #Memory Efficiency #Inference Acceleration #Training-Free #Cache Mechanism #GPU Optimization

2025년 10월 8일

[논문리뷰] SwiReasoning: Switch-Thinking in Latent and Explicit for Pareto-Superior Reasoning LLMs

본 연구는 훈련 없이 잠재 공간 추론을 사용하는 대규모 언어 모델(LLMs)이 겪는 두 가지 주요 문제점을 해결하고자 합니다.

#Review #LLM Reasoning #Latent Thinking #Explicit Thinking #Training-Free #Token Efficiency #Accuracy Improvement #Dynamic Switching #Entropy-based Control

2025년 10월 7일

[논문리뷰] DyPE: Dynamic Position Extrapolation for Ultra High Resolution Diffusion

본 논문은 Diffusion Transformer (DiT) 모델을 재훈련 없이 초고해상도 이미지(예: 16M+ 픽셀 )를 생성할 수 있도록 하는 것을 목표로 합니다.

#Review #Diffusion Models #Transformer Architecture #Positional Encoding #High-Resolution Image Generation #Extrapolation #Dynamic Adaptation #Training-Free

2025년 10월 24일

[논문리뷰] Video Reasoning without Training

본 논문은 Large Multimodal Models (LMMs) 기반 비디오 추론 시 발생하는 높은 연산 비용과 추론 과정 제어의 한계 를 해결하고자 합니다.

#Review #Video Reasoning #Large Multimodal Models (LMMs)#Inference-Time Optimization #Entropy-Based Objective #Training-Free #KV-Cache Steering #Micro-Exploration #Macro-Exploitation

2025년 10월 22일

[논문리뷰] GuideFlow3D: Optimization-Guided Rectified Flow For Appearance Transfer

본 논문은 입력 3D 객체와 외형 객체 간의 기하학적 차이가 클 때, 기존 3D 외형 전이 방법론이 실패하는 문제를 해결하고자 합니다.

#Review #3D Appearance Transfer #Rectified Flow #Generative Models #Optimization-Guided Sampling #Neural Latent Representations #Training-Free #GPT-Based Evaluation

2025년 10월 21일

[논문리뷰] NANO3D: A Training-Free Approach for Efficient 3D Editing Without Masks

본 논문은 기존 3D 객체 편집 방법들이 비효율적이고 일관성이 부족하며, 편집되지 않은 영역을 보존하는 데 실패하는 문제를 해결하고자 합니다.

#Review #3D Object Editing #Training-Free #FlowEdit #Mask-Free #Deep Generative Models #TRELLIS #Data Generation #Geometric Consistency

2025년 10월 20일