#Small Language Models

10개의 포스트

[논문리뷰] Program-as-Weights: A Programming Paradigm for Fuzzy Functions

본 논문은 현대의 복잡한 소프트웨어 작업들이 정교한 규칙으로 정의되기 어렵다는 점에 주목하여, 이를 LLM API에 의존할 때 발생하는 높은 비용, 낮은 로컬리티(locality), 재생산성 문제 등을 해결하고자 한다 .

#Review #Fuzzy Functions #Program-as-Weights #Neural Compiler #Parameter-Efficient Fine-Tuning #LoRA #Small Language Models #FuzzyBench

2026년 7월 2일

[논문리뷰] VibeThinker-3B: Exploring the Frontier of Verifiable Reasoning in Small Language Models

본 논문은 3B 파라미터 규모의 소형 모델(SLM)이 대형 모델(LLM)의 전유물로 여겨지던 최전선 수준의 논리적 추론 능력을 달성할 수 있는지 검증하고자 한다.

#Review #Small Language Models #Verifiable Reasoning #Reinforcement Learning #Parametric Compression-Coverage Hypothesis #Reasoning-Knowledge Decoupling #Test-time Scaling

2026년 6월 15일

[논문리뷰] OCC-RAG: Optimal Cognitive Core for Faithful Question Answering

본 논문은 범용 LLM이 파라미터 내 방대한 지식에 의존하여 주어진 Context를 무시하거나 할루시네이션(Hallucination)을 생성하는 문제를 해결하고자 합니다.

#Review #Small Language Models #Context Question Answering #Multi-hop Reasoning #Faithfulness #Mid-training #Synthetic Data #Abstention

2026년 6월 2일

[논문리뷰] Code-Guided Reasoning for Small Language Models: Evaluating Executable MCQA Scaffolds

본 연구는 SLMs의 제한된 추론 능력을 극복하기 위해 코드 실행 기반의 구조화된 추론 환경을 도입하는 것을 핵심 목표로 합니다. 기존의 Chain-of-Thought (CoT) 기법은 복잡한 다단계 추론 과정에서 Hallucination이나 논리적 비약이 발생하기 쉽다는 한계가 존재합니다.

#Review #Small Language Models #Chain-of-Thought #Executable Scaffolds #MCQA #Code-Guided Reasoning #Symbolic Execution

2026년 5월 19일

[논문리뷰] The Cognitive Penalty: Ablating System 1 and System 2 Reasoning in Edge-Native SLMs for Decentralized Consensus

저자들은 Qwen-3.5-9B를 기반으로 Sentinel-Bench라는 평가 프레임워크를 구축하여 System 1과 System 2 간의 성능을 정량적으로 비교 분석하였다. 동일한 파라미터 환경에서 reasoning toggle만을 조정하여 840번의 독립적인 추론을 수행하였다.

#Review #Small Language Models #Decentralized Autonomous Organizations #Inference-time Compute #System 1 vs System 2 #Sentinel-Bench #Adversarial Robustness #Cognitive Collapse

2026년 4월 21일

[논문리뷰] Phi-4-reasoning-vision-15B Technical Report

본 논문은 추론 능력, 효율성, 학습 데이터 요구사항의 균형을 맞춘 소형 오픈소스 멀티모달 추론 모델인 Phi-4-reasoning-vision-15B 를 개발하는 것을 목표로 합니다.

#Review #Multimodal LLMs #Efficient AI #Reasoning Models #Vision-Language Models #Data Curation #Mid-Fusion #High-Resolution Vision #Small Language Models

2026년 3월 4일

[논문리뷰] AgentCPM-Report: Interleaving Drafting and Deepening for Open-Ended Deep Research

본 논문은 기존 언어 모델 기반 심층 연구 보고서 생성 시스템들이 겪는 한계를 극복하는 것을 목표로 합니다. 특히, 정적 계획에 의존하여 통찰력에 제한이 있고, 배포 및 데이터 보안 문제로 인해 대규모의 독점 모델에 의존하는 경향을 해소하고자 합니다.

#Review #Deep Research #Agentic Systems #Writing As Reasoning Policy (WARP)#Outline Generation #Iterative Refinement #Reinforcement Learning (RL)#Small Language Models

2026년 2월 9일

[논문리뷰] Xmodel-2.5: 1.3B Data-Efficient Reasoning SLM

이 논문은 대규모 언어 모델(LLM)이 복잡한 다단계 추론 능력을 갖추고 있음에도 불구하고 높은 연산 요구사항으로 인해 엣지 또는 비용에 민감한 환경에서의 배포가 어렵다는 문제를 해결하고자 합니다.

#Review #Small Language Models #Data Efficiency #Reasoning #Maximal-Update Parameterization #FP8 Mixed Precision #Optimizer Scheduling #Long-Context Adaptation #Agent AI

2025년 11월 30일

[논문리뷰] Tiny Model, Big Logic: Diversity-Driven Optimization Elicits Large-Model Reasoning Ability in VibeThinker-1.5B

이 논문은 소규모 모델이 강력한 추론 능력을 갖추기 어렵다는 기존의 통념에 도전하고, 1.5B 파라미터 의 경량 모델인 VibeThinker-1.5B 가 대규모 모델에 필적하는 추론 능력을 경제적으로 달성할 수 있음을 입증하는 것을 목표로 합니다.

#Review #Small Language Models #Reasoning #Diversity Optimization #Supervised Fine-Tuning (SFT)#Reinforcement Learning (RL)#Spectrum-to-Signal Principle (SSP)#Mathematical Reasoning #Code Generation

2025년 11월 11일

[논문리뷰] Performance Trade-offs of Optimizing Small Language Models for E-Commerce

본 논문은 대규모 상용 LLM의 높은 비용과 리소스 제약 문제를 해결하기 위해, 소규모 오픈-웨이트 모델이 특정 도메인 작업에서 효율적인 대안이 될 수 있는지 검증하는 것을 목표로 합니다.

#Review #Small Language Models #E-commerce #Intent Recognition #Fine-tuning #QLoRA #Quantization #GPTQ #GGUF #Hardware-aware Optimization

2025년 10월 31일