[논문리뷰] VTC-R1: Vision-Text Compression for Efficient Long-Context Reasoning본 논문은 대규모 언어 모델(LLM)의 long-context reasoning 에서 발생하는 심각한 효율성 병목 현상을 해결하고자 합니다.#Review#Vision-Text Compression#Long-Context Reasoning#LLM Efficiency#Vision-Language Models#Iterative Reasoning#Mathematical Problem Solving#Inference Speedup2026년 1월 29일댓글 수 로딩 중
[논문리뷰] Typhoon-S: Minimal Open Post-Training for Sovereign Large Language Models본 연구는 제한된 자원과 엄격한 투명성 제약이 있는 환경에서, 지역 또는 국가 기관이 모델 가중치, 훈련 데이터, 배포에 대한 통제력을 유지할 수 있도록 하는 소버린 대규모 언어 모델(LLM) 의 최소한의 공개 포스트 트레이닝 레시피 를 개발하는 것을 목표로 합니다.#Review#Sovereign LLMs#Post-Training#Instruction Tuning#Supervised Fine-tuning#On-Policy Distillation#Reinforcement Learning#Knowledge Injection#Thai Language2026년 1월 29일댓글 수 로딩 중
[논문리뷰] Self-Improving Pretraining: using post-trained models to pretrain better models본 논문은 대규모 언어 모델(LLM)의 생성 안전성, 사실성 및 전반적인 품질 문제를 사전 훈련 단계에서부터 해결하는 것을 목표로 합니다.#Review#Self-Improving Pretraining#Reinforcement Learning (RL)#Large Language Models (LLMs)#Quality Control#Factuality#Safety#Post-trained Models#Pretraining Data Augmentation2026년 1월 29일댓글 수 로딩 중
[논문리뷰] Scaling Embeddings Outperforms Scaling Experts in Language Models이 논문은 대규모 언어 모델(LLMs)에서 Mixture-of-Experts (MoE) 아키텍처가 겪는 효율성 한계를 극복하기 위해 임베딩 스케일링 을 새로운 희소성 스케일링 차원으로 탐구하는 것을 목표로 합니다.#Review#Embedding Scaling#N-gram Embedding#Mixture-of-Experts (MoE)#Large Language Models (LLMs)#Parameter Efficiency#Inference Optimization#Speculative Decoding2026년 1월 29일댓글 수 로딩 중
[논문리뷰] Scalable Power Sampling: Unlocking Efficient, Training-Free Reasoning for LLMs via Distribution Sharpening본 논문의 핵심 목표는 LLM의 추론 성능을 향상시키는 데 사용되는 강화 학습(RL) 기반 후처리 및 MCMC(Markov Chain Monte Carlo) 기반 파워 샘플링 의 높은 계산 비용 문제를 해결하는 것입니다.#Review#LLM Reasoning#Distribution Sharpening#Power Sampling#Training-Free#Monte Carlo Estimation#Jackknife Correction#Autoregressive Generation#Inference Efficiency2026년 1월 29일댓글 수 로딩 중
[논문리뷰] Qwen3-ASR Technical Report본 논문은 Qwen3-ASR 모델 제품군을 소개하며, 기존 ASR 모델의 한계를 넘어선 최첨단 성능과 효율성을 제공하는 것을 목표로 합니다.#Review#ASR#Language Identification#Forced Alignment#Large Audio-Language Models#Multilingual Speech Recognition#Streaming Inference#Qwen3-Omni2026년 1월 29일댓글 수 로딩 중
[논문리뷰] PLANING: A Loosely Coupled Triangle-Gaussian Framework for Streaming 3D Reconstruction본 논문은 기존의 스트리밍 3D 재구성 방식이 고품질 렌더링과 정확한 기하학적 구조를 동시에 달성하기 어렵고, 구조적 중복성이 높아 확장성이 제한되는 문제를 해결하고자 합니다.#Review#Streaming 3D Reconstruction#Hybrid Representation#Triangle Primitives#Neural Gaussians#Geometric Accuracy#High-Fidelity Rendering#Embodied AI#Monocular SLAM2026년 1월 29일댓글 수 로딩 중
[논문리뷰] OCRVerse: Towards Holistic OCR in End-to-End Vision-Language Models본 논문은 기존의 파편화된 OCR 접근법의 한계를 극복하고, 텍스트 중심(Text-centric) 및 비전 중심(Vision-centric) OCR 기능을 통합하는 최초의 엔드-투-엔드(end-to-end) 통합 OCR 방법론 인 OCRVerse를 제안합니다.#Review#Holistic OCR#Vision-Language Models#Multi-domain Training#Text-centric OCR#Vision-centric OCR#SFT-RL#Code Generation#Document Understanding2026년 1월 29일댓글 수 로딩 중
[논문리뷰] MetricAnything: Scaling Metric Depth Pretraining with Noisy Heterogeneous Sources이 논문은 이질적인 센서 노이즈, 카메라 의존적 편향, 그리고 노이즈가 많은 교차 소스 3D 데이터의 모호성으로 인해 확장이 어려웠던 Metric Depth Estimation 의 문제를 해결하고자 합니다.#Review#Metric Depth Estimation#Pretraining#Foundation Models#Sparse Prompts#Heterogeneous Data#Zero-Shot Learning#Multi-modal Learning2026년 1월 29일댓글 수 로딩 중
[논문리뷰] MMFineReason: Closing the Multimodal Reasoning Gap via Open Data-Centric Methods본 논문은 고품질 추론 데이터의 부족으로 인해 독점 시스템에 비해 뒤처지는 오픈소스 멀티모달 모델의 한계를 극복하는 것을 목표로 합니다.#Review#Multimodal Reasoning#Data-centric AI#Chain-of-Thought#Large Language Models#Visual Question Answering#STEM Reasoning#Dataset#Fine-tuning2026년 1월 29일댓글 수 로딩 중
[논문리뷰] MAD: Modality-Adaptive Decoding for Mitigating Cross-Modal Hallucinations in Multimodal Large Language Models본 논문은 Multimodal Large Language Models (MLLMs) 에서 발생하는 교차 모달리티 환각 현상(cross-modal hallucinations) 을 해결하는 것을 목표로 합니다.#Review#Multimodal LLM#Cross-modal Hallucination#Contrastive Decoding#Modality-Adaptive Decoding#Self-Assessment#Audio-Visual Language Model#Training-Free2026년 1월 29일댓글 수 로딩 중
[논문리뷰] Llama-3.1-FoundationAI-SecurityLLM-Reasoning-8B Technical Report사이버보안 도메인에서 복잡한 다단계 분석을 수행하는 데 특화된 최초의 오픈소스 네이티브 추론 모델 인 Foundation-Sec-8B-Reasoning 을 개발하는 것이 목표입니다.#Review#Cybersecurity LLM#Reasoning Model#Supervised Fine-Tuning#Reinforcement Learning#Verifiable Rewards#8B Parameters#Open-Source AI2026년 1월 29일댓글 수 로딩 중
[논문리뷰] Language-based Trial and Error Falls Behind in the Era of ExperienceLarge Language Models (LLMs)가 언어 기반이 아닌 새로운 환경(예: 상징적, 공간적 태스크)에서 낮은 성능을 보이는 문제를 해결하는 것이 목표입니다.#Review#Large Language Models#Reinforcement Learning#Exploration Efficiency#Sub-Scale Collaboration#Out-of-Distribution Tasks#Agentic AI#Supervised Fine-Tuning2026년 1월 29일댓글 수 로딩 중
[논문리뷰] Idea2Story: An Automated Pipeline for Transforming Research Concepts into Complete Scientific NarrativesIdea2Story는 기존 LLM 기반 자율 과학 연구 에이전트의 비효율성, 컨텍스트 윈도우 한계, 취약한 추론 및 환각 문제를 해결하는 것을 목표로 합니다. 문헌 이해를 온라인 실시간 추론에서 오프라인 지식 구성으로 전환하여, 확장 가능하고 신뢰할 수 있는 자율 과학 발견을 위한 실용적인 기반을 마련하고자 합니다.#Review#Autonomous Scientific Discovery#LLM Agents#Knowledge Graph#Pre-computation#Research Pattern#Methodology#Retrieval-Augmented Generation#Review-Guided Refinement2026년 1월 29일댓글 수 로딩 중
[논문리뷰] Exploring Reasoning Reward Model for Agents기존 에이전트 RL(Agentic Reinforcement Learning) 방법론이 최종 결과 기반의 희소한 보상에 의존하여 중간 추론 과정의 품질을 제대로 반영하지 못하는 문제를 해결합니다.#Review#Agentic Reinforcement Learning#Reward Modeling#Reasoning-aware Feedback#Large Language Models (LLMs)#Multi-modal Agents#Fine-tuning#Critique Generation2026년 1월 29일댓글 수 로딩 중
[논문리뷰] Everything in Its Place: Benchmarking Spatial Intelligence of Text-to-Image Models현재 Text-to-Image (T2I) 모델들이 복잡한 공간 관계(공간 인식, 추론, 상호작용) 처리에서 실패하는 한계를 해결하고, 기존의 짧고 정보 밀도가 낮은 프롬프트 기반 벤치마크의 부적합성을 극복하는 것을 목표로 합니다.#Review#Text-to-Image Models#Spatial Intelligence#Benchmark#Evaluation#Prompt Engineering#Multimodal LLMs#Fine-tuning#Spatial Reasoning2026년 1월 29일댓글 수 로딩 중
[논문리뷰] DynamicVLA: A Vision-Language-Action Model for Dynamic Object Manipulation기존 VLA 모델들이 정적 객체 조작에서는 강점을 보이지만, 동적 객체 조작 시 빠른 인지(perception) , 시간적 예측(temporal anticipation) , 그리고 연속적인 제어(continuous control) 가 필요한 상황에서 겪는 어려움을 해결하는 것이 주요 목표입니다.#Review#Vision-Language-Action (VLA) Models#Dynamic Object Manipulation#Robotics#Continuous Inference#Latent-aware Action Streaming#Real-time Control#Perception-Execution Gap2026년 1월 29일댓글 수 로딩 중
[논문리뷰] Discovering Hidden Gems in Model Repositories본 논문은 대규모 모델 저장소에서 사용자에게 잘 알려지지 않았지만 성능이 뛰어난 '숨겨진 보석' 모델들을 효율적으로 발견하는 것을 목표로 합니다. 특히, 현재 모델 사용의 집중이 효율적인 시장 선택의 결과인지, 아니면 우수한 모델들이 단순히 간과되고 있는지 규명하고자 합니다.#Review#Model Discovery#Hidden Gems#Sequential Halving#Multi-Armed Bandit#Model Repositories#Large Language Models#Performance Evaluation2026년 1월 29일댓글 수 로딩 중
[논문리뷰] DeepSearchQA: Bridging the Comprehensiveness Gap for Deep Research Agents이 논문은 AI 에이전트가 복잡한 다단계 정보 탐색 작업 에서 포괄적인 답변 목록 을 생성하는 능력을 평가하기 위한 새로운 벤치마크인 DeepSearchQA 를 소개합니다.#Review#AI Agents#Deep Research#Benchmark#Information Retrieval#Comprehensiveness#Multi-step Reasoning#Evaluation#LLM-as-a-Judge2026년 1월 29일댓글 수 로딩 중
[논문리뷰] ConceptMoE: Adaptive Token-to-Concept Compression for Implicit Compute Allocation대규모 언어 모델(LLMs)이 모든 토큰에 균일하게 연산을 할당하여 비효율적인 연산 자원 사용을 초래하는 문제를 해결하는 것이 목표입니다.#Review#MoE#LLMs#Adaptive Compression#Token Merging#Compute Allocation#Efficiency#Vision-Language Models#Continual Training2026년 1월 29일댓글 수 로딩 중