#Large Language Model

23개의 포스트

[논문리뷰] DrugGen 2: A disease-aware language model for enhancing drug discovery

본 논문은 기존의 약물 생성 모델들이 질병의 맥락을 고려하지 않고 표적 단백질이나 일반적인 분자 특성에만 의존하여 생성된 약물의 치료적 타당성이 부족하다는 문제를 해결하고자 합니다 .

#Review #Drug Design #Drug Repositioning #Large Language Model #Reinforcement Learning #Disease-Aware #GRPO #SMILES

2026년 7월 9일

[논문리뷰] The Mirage of Optimizing Training Policies: Monotonic Inference Policies as the Real Objective for LLM Reinforcement Learning

본 논문은 LLM RL 파이프라인에서 발생하는 Training-Inference Mismatch가 단순히 알고리즘적 오류를 넘어 Objective Misalignment를 유발한다는 점을 지적한다.

#Review #Large Language Model #Reinforcement Learning #Training-Inference Mismatch #Monotonic Policy Improvement #Policy Optimization #Alignment

2026년 7월 5일

[논문리뷰] DOPD: Dual On-policy Distillation

본 논문은 OPD 환경에서 특권 정보를 주입할 때 발생하는 Privilege Illusion 문제를 해결하고자 합니다.

#Review #On-policy Distillation #Privileged Information #Privilege Illusion #Advantage-aware #Dual Distillation #Large Language Model #Vision-Language Model

2026년 6월 30일

[논문리뷰] AsyncOPD: How Stale Can On-Policy Distillation Be?

본 논문은 LLM 사후 학습에서 OPD가 겪는 On-policy systems bottleneck 문제를 해결하기 위해 비동기식 학습 파이프라인의 도입 필요성을 제기한다. 기존의 동기식 학습은 rollout 생성이 완료될 때까지 학습기를 대기시켜 하드웨어 활용률을 저하시킨다.

#Review #On-policy Distillation #Asynchronous RL #Reverse KL #Staleness #Teacher Cache #Multi-sample MC #Large Language Model

2026년 6월 29일

[논문리뷰] Why Muon Outperforms Adam: A Curvature Perspective

본 논문은 LLM pretraining에서 Muon이 왜 Adam보다 약 2배 빠른 학습 효율을 보이는지, 그 근본적인 기하학적 이유를 규명하고자 합니다.

#Review #Muon #Adam #Curvature #Normalized Directional Sharpness (NDS)#Large Language Model #Optimization Landscape #Hessian

2026년 6월 8일

[논문리뷰] Your UnEmbedding Matrix is Secretly a Feature Lens for Text Embeddings

본 논문은 LLM이 우수한 zero-shot 능력을 갖추고 있음에도 불구하고, 범용 text embedding 모델로 활용될 때는 성능이 저하되는 원인을 분석하고 해결하고자 한다.

#Review #Large Language Model #Text Embedding #Mechanistic Interpretability #Unembedding Matrix #Dimensionality Reduction #Logit Lens #Edge Spectrum

2026년 6월 7일

[논문리뷰] TransitLM: A Large-Scale Dataset and Benchmark for Map-Free Transit Route Generation

본 논문은 기존의 대중교통 경로 계획 시스템이 복잡한 맵 인프라와 외부 라우팅 엔진에 과도하게 의존하고 있다는 문제점을 해결하고자 한다. 일반적인 LLM은 경로 계획의 기본이 되는 위상 구조를 제대로 이해하지 못해 환각(hallucination)을 일으키거나 연결이 끊긴 경로를 생성하는 한계를 보인다.

#Review #TransitLM #Route Generation #Map-Free #Large Language Model #Continual Pre-Training #Urban Mobility #Benchmark

2026년 5월 21일

[논문리뷰] From Runnable to Shippable: Multi-Agent Test-Driven Development for Generating Full-Stack Web Applications from Requirements

본 논문은 현재의 코딩 에이전트가 웹 애플리케이션 생성 시 겪는 70% 이상의 기능적 요구사항 미충족 문제를 해결하는 것을 목표로 합니다. 기존의 에이전트는 코드 파일이나 터미널 출력만을 기반으로 검증을 수행하지만, 웹 애플리케이션의 정확성은 브라우저 환경에서의 동적 상호작용을 통해서만 평가될 수 있습니다 .

#Review #Multi-Agent System #Test-Driven Development #Web Development #Code Generation #Closed-Loop Validation #Large Language Model

2026년 5월 18일

[논문리뷰] GQLA: Group-Query Latent Attention for Hardware-Adaptive Large Language Model Decoding

본 연구는 MLA가 특정 하드웨어(예: NVIDIA H100)의 연산-대역폭 비율에 지나치게 종속되어 있다는 문제를 해결합니다.

#Review #Large Language Model #KV-cache #Multi-head Latent Attention #GQLA #Hardware-Adaptive #Roofline Model #Tensor Parallelism

2026년 5월 17일

[논문리뷰] Skills-Coach: A Self-Evolving Skill Optimizer via Training-Free GRPO

본 연구는 LLM 기반 Agent 생태계에서 Skill이 범람함에도 불구하고, 개별 개발자가 특정 목적 위주로 설계하여 기능적 파편화(Fragmentation)와 커버리지 부족 문제를 겪고 있는 현실을 해결하고자 합니다 .

#Review #Large Language Model #Agent #Skill Self-Evolution #GRPO #Benchmark #Automation

2026년 5월 5일

[논문리뷰] HeavySkill: Heavy Thinking as the Inner Skill in Agentic Harness

본 논문은 현대의 복잡한 Agentic Harness 설계 이면에 숨겨진 실질적인 성능 구동 메커니즘을 규명하고 이를 단순화하고자 한다. 기존의 오케스트레이션 설계는 시스템이 매우 복잡하여 실질적인 추론 메커니즘을 파악하기 어렵다는 한계가 있었다.

#Review #Agentic Harness #Heavy Thinking #Large Language Model #Test-Time Scaling #Sequential Deliberation #Parallel Reasoning #RLVR

2026년 5월 5일

[논문리뷰] PlayCoder: Making LLM-Generated GUI Code Playable

본 논문은 GUI 행동의 정확성을 검증하고 이를 기반으로 코드를 반복적으로 수정하는 다중 에이전트 프레임워크인 PlayCoder를 제안합니다 . PlayDeveloper는 리포지토리 문맥을 활용하여 초기 코드를 생성하고, PlayTester는 GUI를 직접 실행하며 시각적/기능적 결함을 진단합니다.

#Review #Large Language Model #Code Generation #Multi-Agent #GUI Applications #Automated Program Repair

2026년 4월 21일

[논문리뷰] OPUS: Towards Efficient and Principled Data Selection in Large Language Model Pre-training in Every Iteration

대규모 언어 모델(LLM) 사전 훈련에서 고품질 데이터의 고갈 문제인 '데이터 장벽(Data Wall)'에 직면함에 따라, 기존의 비효율적이거나 최적화기 비인지적인 데이터 선택 방법의 한계를 해결하고자 합니다.

#Review #Data Selection #Large Language Model #Pre-training #Optimizer-Induced Utility #Ghost Technique #CountSketch #Boltzmann Sampling

2026년 2월 10일

[논문리뷰] Are LLM Decisions Faithful to Verbal Confidence?

대규모 언어 모델(LLM)이 자체 불확실성을 표현하는 '언어적 자신감'이 모델의 실제 추론, 지식 또는 의사 결정에 얼마나 충실한지 평가하는 것을 목표로 합니다. 특히, LLM이 다양한 오류 페널티에 반응하여 질문 응답 또는 기권 정책을 전략적으로 조정하는지 여부를 테스트합니다.

#Review #Large Language Model #Uncertainty Quantification #Verbal Confidence #Abstention #Decision-Making #Risk-Sensitive AI #Utility Maximization

2026년 1월 12일

[논문리뷰] Motif 2 12.7B technical report

대규모 언어 모델(LLM)의 효율성 한계를 확장하고, 제한된 컴퓨팅 자원 내에서 Motif-2-12.7B 모델이 우수한 성능을 발휘할 수 있음을 입증하는 것을 목표로 합니다. 특히 아키텍처 혁신과 시스템 수준 최적화를 통해 대형 모델에 필적하는 능력을 소규모 파라미터로 구현하고자 합니다.

#Review #Large Language Model #LLM Efficiency #Grouped Differential Attention #Kernel Fusion #Parallel Muon #Supervised Fine-tuning #Architectural Scaling #Instruction Following

2025년 11월 12일

[논문리뷰] Hunyuan-MT Technical Report

본 논문은 오픈소스 다국어 기계 번역 모델인 Hunyuan-MT-7B 및 Hunyuan-MT-Chimera-7B 를 소개하며, 33개 언어 에 대한 양방향 번역에서 최첨단 성능을 달성하고 특히 만다린어와 소수 민족 언어 및 방언 번역의 품질을 향상시키는 것을 목표로 합니다.

#Review #Machine Translation #Large Language Model #Multilingual #Low-Resource Languages #Reinforcement Learning #Weak-to-Strong Learning #Slow Thinking

2025년 9월 11일

[논문리뷰] VibeVoice Technical Report

본 논문은 기존 시스템의 한계로 남아있던 장문(long-form) 및 다중 화자(multi-speaker) 대화형 오디오 합성의 확장성, 자연스러운 턴-테이킹, 내용 인식 생성 문제를 해결하는 것을 목표로 합니다.

#Review #Speech Synthesis #Long-form Audio #Multi-speaker #Next-token Diffusion #Speech Tokenizer #Large Language Model #Variational Autoencoder #Audio Compression

2025년 8월 27일

[논문리뷰] MeshCoder: LLM-Powered Structured Mesh Code Generation from Point Clouds

본 논문은 3D 포인트 클라우드로부터 편집 가능한 Blender Python 스크립트 형태의 구조화된 메시 코드를 생성하는 새로운 프레임워크인 MeshCoder 를 제안합니다.

#Review #LLM #Point Clouds #3D Reconstruction #Structured Mesh #Blender Python #Shape Editing #Part-based Representation #Large Language Model

2025년 8월 21일

[논문리뷰] GLM-4.5: Agentic, Reasoning, and Coding (ARC) Foundation Models

본 논문은 오픈소스 MoE(Mixture-of-Experts) 기반 대규모 언어 모델인 GLM-4.5 를 소개합니다. 핵심 목표는 에이전트, 추론, 코딩(ARC) 태스크 전반에서 강력한 성능을 달성하고, 사고 및 직접 응답 모드를 지원하는 하이브리드 추론 방식을 통해 계산 효율성을 극대화하는 것입니다.

#Review #Large Language Model #Mixture-of-Experts #Agentic AI #Reasoning #Code Generation #Reinforcement Learning #Foundation Model

2025년 8월 11일

[논문리뷰] CoTox: Chain-of-Thought-Based Molecular Toxicity Reasoning and Prediction

기존 AI/ML 독성 예측 모델의 한계(데이터 의존성, 해석 불가능성)와 LLM 기반 접근법의 문제점(SMILES 이해 부족, 생물학적 맥락 부재, 추론 비활용)을 극복하는 것을 목표로 합니다.

#Review #Toxicity Prediction #Large Language Model #Chain-of-Thought #Drug Development #Cheminformatics #Interpretable AI #IUPAC Nomenclature

2025년 8월 7일

[논문리뷰] Llama-3.1-FoundationAI-SecurityLLM-8B-Instruct Technical Report

본 연구는 대규모 언어 모델(LLM)의 사이버 보안 분야 통합이 데이터 부족, 복잡한 표현, 안전 및 규제 문제로 인해 제한적이라는 문제를 해결하고자 합니다.

#Review #Large Language Model #Cybersecurity #Instruction Tuning #Direct Preference Optimization #Cyber Threat Intelligence #Foundation Model #Chatbot

2025년 8월 5일

[논문리뷰] HyperAgent: Leveraging Hypergraphs for Topology Optimization in Multi-Agent Communication

본 논문은 대규모 언어 모델(LLM) 기반 멀티 에이전트 시스템에서 발생하는 비효율적인 그룹 협업 모델링(단순한 쌍별 관계) 및 제한적인 태스크 적응성으로 인한 통신 비효율성 문제를 해결하는 것을 목표로 합니다.

#Review #Large Language Model #Multi-agent Systems #Multi-agent Communication #Graph Neural Networks #Hypergraph #Topology Optimization #Variational Autoencoder #Sparsity Regularization

2025년 10월 16일

[논문리뷰] KORMo: Korean Open Reasoning Model for Everyone

본 논문은 한국어와 영어를 지원하는 최초의 완전 공개(Fully Open) 이중 언어 대규모 언어 모델(LLM) 인 KORMo 를 구축하는 것을 목표로 합니다.

#Review #Large Language Model #Korean #Bilingual #Synthetic Data #Fully Open Model #Tokenizer #Reasoning #Pretraining #Instruction Tuning

2025년 10월 13일