Review

[논문리뷰] GLM-5: from Vibe Coding to Agentic Engineering

본 논문은 AI 모델이 인간의 지시(vibe coding)에 의존하는 것을 넘어 자율적인 계획, 구현 및 반복 이 가능한 Agentic Engineering 패러다임으로 전환하는 것을 목표로 합니다.

#Review #Foundation Model #Agentic AI #Reinforcement Learning #Sparse Attention #Software Engineering #Long-Context Models #GPU Optimization

2026년 2월 17일

[논문리뷰] Does Socialization Emerge in AI Agent Society? A Case Study of Moltbook

본 논문은 대규모 언어 모델(LLM) 에이전트 사회에서 인간 사회와 유사한 사회화(socialization) 현상이 발생하는지 탐구합니다.

#Review #AI Agent Societies #Socialization #Large Language Models (LLMs)#Collective Dynamics #Semantic Analysis #Network Analysis #Moltbook

2026년 2월 17일

[논문리뷰] ClinAlign: Scaling Healthcare Alignment from Clinician Preference

대규모 언어 모델(LLM)을 의료 분야에서 의사의 세밀한 선호도 및 전문 표준에 맞춰 정렬하는 문제를 해결하는 것이 목표입니다. 기존 방법론의 일반적인 목표와 신뢰할 수 없는 자동 평가자의 한계를 극복하고, 확장 가능한 방식으로 임상 정렬(clinical alignment)을 달성하고자 합니다.

#Review #Healthcare AI #LLM Alignment #Clinician Preference #Rubric-based RLHF #Medical LLMs #Data Curation #HealthBench #Principle-based Supervision

2026년 2월 17일

[논문리뷰] Causal-JEPA: Learning World Models through Object-Level Latent Interventions

기존 객체 중심(object-centric) 월드 모델이 상호작용 의존적 다이내믹스를 포착하지 못하고 자가 다이내믹스나 우발적 상관관계에 의존하는 한계를 해결하고자 합니다.

#Review #World Models #Object-Centric Representations #Latent Interventions #Masked Prediction #Causal Inductive Bias #Joint Embedding Predictive Architecture (JEPA)#Visual Question Answering (VQA)#Model Predictive Control (MPC)

2026년 2월 17일

[논문리뷰] COMPOT: Calibration-Optimized Matrix Procrustes Orthogonalization for Transformers Compression

본 논문은 Transformer 모델의 사후 학습 압축에서 발생하는 정확도 저하 문제를 해결하고자 합니다.

#Review #Transformer Compression #Matrix Factorization #Sparse Dictionary Learning #Post-Training Quantization #Procrustes Analysis #Orthogonal Dictionary #Dynamic Allocation

2026년 2월 17일

[논문리뷰] UniWeTok: An Unified Binary Tokenizer with Codebook Size 2^{128} for Unified Multimodal Large Language Model

본 논문은 통합 멀티모달 대규모 언어 모델(MLLM)이 요구하는 고충실도 재구성, 복합적인 의미 추출 및 생성 적합성을 동시에 지원하는 시각적 표현을 제공하는 문제를 해결하고자 합니다.

#Review #Multimodal LLM #Visual Tokenizer #Binary Codebook #Image Generation #Semantic Extraction #Pre-Post Distillation #Hybrid Architecture

2026년 2월 16일

[논문리뷰] REDSearcher: A Scalable and Cost-Efficient Framework for Long-Horizon Search Agents

본 논문은 대규모 언어 모델(LLM)이 긴 탐색 경로와 많은 상호작용이 필요한 심층 검색 태스크를 수행할 때 겪는 어려움, 특히 고품질 훈련 데이터 부족과 높은 상호작용 비용 문제를 해결하는 것을 목표로 합니다.

#Review #Long-Horizon Search #Multimodal LLM #Task Synthesis #Agentic Mid-Training #Reinforcement Learning #Tool-Augmented Agents #Web Search

2026년 2월 16일

[논문리뷰] Qute: Towards Quantum-Native Database

논문은 고전적인 컴퓨터로는 처리하기 점점 어려워지는 워크로드를 가속화하기 위해 양자 컴퓨터를 활용하는 양자 데이터베이스(Qute) 를 제안합니다.

#Review #Quantum Database #Quantum Computing #SQL Compilation #Hybrid Optimizer #Quantum Indexing #Fidelity-Preserving Storage #Grover's Algorithm

2026년 2월 16일

[논문리뷰] Query as Anchor: Scenario-Adaptive User Representation via Large Language Model

본 논문은 정적이고 태스크에 독립적인 사용자 임베딩의 한계를 극복하고, 다양한 하위 시나리오의 요구사항을 통합된 벡터 공간 내에서 충족하는 적응형 사용자 표현 학습 프레임워크를 제안합니다. 특히, 이질적인 멀티모달 데이터를 통합하고 산업 규모에서 시나리오에 특화된 사용자 이해를 가능하게 하는 것을 목표로 합니다.

#Review #User Representation Learning #Large Language Models #Scenario-Adaptive #Query-Conditioned #Multi-modal #Prompt Tuning #KV-Cache #Industrial AI

2026년 2월 16일

[논문리뷰] Preliminary sonification of ENSO using traditional Javanese gamelan scales

이 연구는 복잡한 동역학 시스템인 엘니뇨-남방 진동(ENSO)의 데이터를 비서구권 음악적 프레임워크(자바 가믈란 음계)를 사용하여 소리화하는 방법을 탐구합니다.

#Review #Sonification #ENSO #Gamelan Scales #Complex Systems #Phase Space Analysis #Recurrence Quantification #Parameter Mapping

2026년 2월 16일

[논문리뷰] Nanbeige4.1-3B: A Small General Model that Reasons, Aligns, and Acts

컴팩트한 30억(3B) 파라미터 규모의 모델인 Nanbeige4.1-3B 를 개발하여 강력한 에이전트 행동, 코드 생성 및 일반적인 추론 능력을 동시에 달성하는 것을 목표로 합니다. 단일 소규모 언어 모델(SLM) 내에서 이러한 다재다능성을 입증하고, 3B 파라미터 모델의 잠재력을 재정의하고자 합니다.

#Review #Small Language Model #Generalist AI #Reasoning #Code Generation #Agentic Behavior #Reinforcement Learning #Tool Use #Deep Search

2026년 2월 16일

[논문리뷰] MoRL: Reinforced Reasoning for Unified Motion Understanding and Generation

인간 모션 이해 및 생성 분야에서 제한적인 추론 능력 과 테스트 시간 계획의 한계 를 극복하는 것을 목표로 합니다. 이를 위해, 모션 이해와 생성을 통합하는 단일 멀티모달 모션 모델 을 제안하여, 논리적 추론과 지각적 사실성을 동시에 개선하고자 합니다.

#Review #Motion Understanding #Motion Generation #Reinforcement Learning #Chain-of-Motion #Multimodal LLM #Human Motion Synthesis #Text-to-Motion

2026년 2월 16일

[논문리뷰] LaViDa-R1: Advancing Reasoning for Unified Multimodal Diffusion Language Models

본 논문은 기존 확산 언어 모델(dLLMs) 기반 추론 시스템이 겪는 태스크 특이성, RL 학습 불안정성, 훈련 신호 부족 등의 문제를 해결하고자 합니다.

#Review #Multimodal Diffusion Models #Reasoning #Reinforcement Learning #Supervised Finetuning #Visual Question Answering #Image Editing #Object Grounding #Policy Gradient

2026년 2월 16일

[논문리뷰] InnoEval: On Research Idea Evaluation as a Knowledge-Grounded, Multi-Perspective Reasoning Problem

이 논문은 대규모 언어 모델(LLM)에 의해 가속화된 연구 아이디어 생성 속도에 비해 평가 역량이 뒤처지는 문제를 해결하고자 합니다. 기존 아이디어 평가 방식이 좁은 지식 기반, 합의 부족, 단일 차원 평가 등의 한계를 가지며, LLM 자체의 편향성 또한 문제가 됨을 지적합니다.

#Review #Research Idea Evaluation #Large Language Models (LLMs)#Knowledge Grounding #Multi-Perspective Reasoning #Agent-based Systems #Scientific Discovery #Peer Review Simulation #Automated Evaluation

2026년 2월 16일

[논문리뷰] FireRed-Image-Edit-1.0 Techinical Report

본 논문은 텍스트 지시 기반 이미지 편집(instruction-based image editing) 분야에서 CNN 의존성을 넘어선 새로운 접근 방식 을 제시하며, 데이터 큐레이션, 모델 아키텍처, 훈련 방법론 및 평가 설계의 체계적인 최적화를 통해 최고 수준의 성능 달성을 목표로 합니다.

#Review #Image Editing #Diffusion Transformer #Instruction-based Editing #Data Curation #Reinforcement Learning #Multimodal Models #REDEdit-Bench #Generative AI

2026년 2월 16일

[논문리뷰] Exposing the Systematic Vulnerability of Open-Weight Models to Prefill Attacks

본 논문은 오픈-웨이트 대규모 언어 모델(LLM)이 프리필(prefill) 공격 에 체계적으로 취약하다는 점을 폭로하는 것을 목표로 합니다.

#Review #Large Language Models #Prefill Attacks #AI Safety #Red Teaming #Vulnerability #Open-Weight Models #Jailbreaking #Generative AI

2026년 2월 16일

[논문리뷰] Experiential Reinforcement Learning

언어 모델(LMs)이 희소하고 지연된 환경 피드백으로부터 학습하는 과정에서 발생하는 비효율성과 불안정성을 해결하는 것이 주요 목표입니다.

#Review #Reinforcement Learning #Language Models #Self-Reflection #Experiential Learning #Policy Optimization #Distillation #Agentic Reasoning

2026년 2월 16일

[논문리뷰] DeepImageSearch: Benchmarking Multimodal Agents for Context-Aware Image Retrieval in Visual Histories

본 논문은 기존의 독립적인 이미지 검색 패러다임이 시각적 히스토리 내의 복잡한 문맥적 의존성을 간과하는 문제를 해결하는 것을 목표로 합니다. 이미지를 자율적인 탐색 작업으로 재구성하여, 모델이 원시 시각적 히스토리에서 다단계 추론을 통해 암묵적인 문맥 단서에 기반한 타겟을 찾아내는 새로운 에이전트 패러다임 을 제시합니다.

#Review #Multimodal Agents #Image Retrieval #Context-Aware #Visual Histories #Benchmarking #Vision-Language Models #Agentic AI

2026년 2월 16일

[논문리뷰] Data Darwinism Part I: Unlocking the Value of Scientific Data for Pre-training

본 논문은 파운데이션 모델 학습 데이터 처리의 체계적인 프레임워크 부재 문제를 해결하고자 합니다.

#Review #Data Darwinism #Scientific Data #Pre-training #Foundation Models #Data Processing Hierarchy #Generative Refinement #Cognitive Completion #Learnability Gap

2026년 2월 16일

[논문리뷰] BrowseComp-V^3: A Visual, Vertical, and Verifiable Benchmark for Multimodal Browsing Agents

기존 벤치마크의 제한적인 태스크 복잡도, 정보 검색 가능성, 평가 차원의 문제를 해결하여 멀티모달 웹 브라우징 에이전트의 심층 검색 역량을 포괄적으로 평가할 수 있는 새롭고 검증 가능한 벤치마크를 개발하는 것을 목표로 합니다.

#Review #Multimodal LLMs #Web Browsing Agents #Deep Search #Benchmark #Tool Use #Process Evaluation #Multimodal Reasoning #Open-world QA

2026년 2월 16일