#Beam Search

5개의 포스트

[논문리뷰] Distilling Long-CoT Reasoning through Collaborative Step-wise Multi-Teacher Decoding

본 논문은 대규모 Long-CoT 모델의 높은 추론 비용을 해결하기 위한 효율적인 reasoning distillation 프레임워크를 제안합니다.

#Review #Reasoning Distillation #Collaborative Decoding #Long-CoT #Predictive Perplexity #Multi-Teacher #Beam Search #Step-wise Synthesis

2026년 5월 17일

[논문리뷰] Context Training with Active Information Seeking

본 논문은 LLM이 배포 후 새로운 정보나 전문 지식이 필요한 상황에서 겪는 적응력의 한계를 해결하기 위해 제안되었습니다. 기존의 closed-loop Context Training 방식은 모델의 내재된 지식에만 의존하므로, 모델이 모르는 외부 지식을 스스로 발견하거나 수정하는 데 결정적인 한계가 있습니다.

#Review #Context Training #Active Information Seeking #Beam Search #Working Memory #LLM Optimization #Context Pollution #Generalization

2026년 5월 13일

[논문리뷰] AccelOpt: A Self-Improving LLM Agentic System for AI Accelerator Kernel Optimization

본 논문은 최신 AI Accelerator(예: Amazon Trainium)에서 고성능 커널을 개발하는 과정이 극도로 어렵고 고비용이라는 문제를 해결하고자 합니다.

#Review #LLM Agent #Kernel Optimization #AI Accelerator #Amazon Trainium #Beam Search #Optimization Memory

2026년 4월 19일

[논문리뷰] MITS: Enhanced Tree Search Reasoning for LLMs via Pointwise Mutual Information

대규모 언어 모델(LLM)의 다단계 추론 과정에서 중간 단계의 품질을 효율적이고 신뢰성 있게 평가하고, 계산 비용이 높은 경로 탐색 문제를 해결하고자 합니다.

#Review #LLM Reasoning #Tree Search #Pointwise Mutual Information (PMI)#Dynamic Sampling #Beam Search #Weighted Voting #Information Theory #Computational Efficiency

2025년 10월 7일

[논문리뷰] Visual Autoregressive Models Beat Diffusion Models on Inference Time Scaling

본 연구는 대규모 언어 모델(LLMs)에서 성공적인 추론 시간 스케일링(search) 전략이 연속적인 잠재 공간을 사용하는 확산 모델(Diffusion Models)에서는 제한적인 이점을 보이는 문제를 해결하고자 합니다.

#Review #Visual Autoregressive Models #Diffusion Models #Inference Time Scaling #Beam Search #Image Generation #Text-to-Image Synthesis #Discrete Latent Space

2025년 10월 21일