Review

[논문리뷰] Toward the Frontiers of Reliable Diffusion Sampling via Adversarial Sinkhorn Attention Guidance

이 논문은 확산 모델의 샘플링 과정에서 발생하는 품질 및 제어 가능성 문제를 해결하고자 합니다.

#Review #Diffusion Models #Guidance Sampling #Optimal Transport #Sinkhorn Algorithm #Self-Attention #Adversarial Perturbation #Image Generation #ControlNet

2025년 11월 12일

[논문리뷰] TiDAR: Think in Diffusion, Talk in Autoregression

본 연구는 대규모 언어 모델(LLM)의 생성 과정에서 확산 모델(Diffusion Models) 의 빠른 병렬 생성 능력과 자기회귀(Autoregressive, AR) 모델 의 높은 품질을 동시에 달성하는 것을 목표로 합니다.

#Review #Hybrid LLM Architecture #Diffusion-Autoregressive #Parallel Token Generation #Speculative Decoding #Structured Attention Masks #LLM Inference Acceleration #KV Cache

2025년 11월 12일

[논문리뷰] Stemming Hallucination in Language Models Using a Licensing Oracle

언어 모델(LMs)의 고질적인 환각(hallucination) 문제, 즉 사실과 다른 정보를 유창하게 생성하는 문제를 해결하는 것이 목표입니다. 통계적 학습 방식의 한계를 극복하고, 구조화된 지식에 대한 결정론적인 진실성 검증 메커니즘 을 통해 LM의 출력에 인식론적 기반 을 마련하고자 합니다.

#Review #Hallucination Mitigation #Language Models #Knowledge Graphs #SHACL Validation #Epistemic Grounding #Retrieval-Augmented Generation #Neuro-symbolic AI

2025년 11월 12일

[논문리뷰] Motif 2 12.7B technical report

대규모 언어 모델(LLM)의 효율성 한계를 확장하고, 제한된 컴퓨팅 자원 내에서 Motif-2-12.7B 모델이 우수한 성능을 발휘할 수 있음을 입증하는 것을 목표로 합니다. 특히 아키텍처 혁신과 시스템 수준 최적화를 통해 대형 모델에 필적하는 능력을 소규모 파라미터로 구현하고자 합니다.

#Review #Large Language Model #LLM Efficiency #Grouped Differential Attention #Kernel Fusion #Parallel Muon #Supervised Fine-tuning #Architectural Scaling #Instruction Following

2025년 11월 12일

[논문리뷰] MathSE: Improving Multimodal Mathematical Reasoning via Self-Evolving Iterative Reflection and Reward-Guided Fine-Tuning

본 연구는 멀티모달 대규모 언어 모델(MLLM)이 복잡한 수학 문제 해결과 같은 추론 태스크에서 겪는 어려움을 극복하는 것을 목표로 합니다. 특히, 기존의 정적인 교사 모델 유래 데이터셋에 의존하는 방식이 모델의 새로운 문제 적응력과 견고한 일반화 능력을 제한한다는 한계를 해결하고자 합니다.

#Review #Multimodal Reasoning #Mathematical Problem Solving #Self-Evolving #Iterative Fine-Tuning #Reward Models #Reflection #Large Language Models (LLMs)

2025년 11월 12일

[논문리뷰] MADD: Multi-Agent Drug Discovery Orchestra

초기 신약 개발 과정에서 히트 분자(hit molecule) 식별 에 필요한 막대한 자원과 기존 AI 방법론의 복잡성 및 접근성 부족 문제를 해결하는 것이 목표입니다.

#Review #Multi-Agent System #Drug Discovery #LLM #Hit Identification #Virtual Screening #Generative AI #Property Prediction #Automated Machine Learning

2025년 11월 12일

[논문리뷰] Lumine: An Open Recipe for Building Generalist Agents in 3D Open Worlds

논문은 복잡한 3D 오픈 월드 환경 에서 인간 수준의 효율성으로 수 시간 길이의 미션을 실시간으로 완수할 수 있는 제너럴리스트 에이전트 를 구축하기 위한 '오픈 레시피'인 Lumine을 제시합니다.

#Review #Generalist Agent #3D Open World #Vision-Language Model #Imitation Learning #Real-time Inference #Hybrid Thinking #Action Chunking #Genshin Impact

2025년 11월 12일

[논문리뷰] LoopTool: Closing the Data-Training Loop for Robust LLM Tool Calls

기존 LLM 툴 학습의 정적 합성 데이터 파이프라인 이 모델의 약점에 적응하지 못하고 노이즈 있는 레이블을 유지하여 훈련 효율성을 저해하는 문제를 해결합니다.

#Review #Large Language Models (LLMs)#Tool Learning #Data Generation #Model Training #Closed-Loop Framework #Reinforcement Learning (RL)#Data Refinement #Self-Correction

2025년 11월 12일

[논문리뷰] Agentic Refactoring: An Empirical Study of AI Coding Agents

이 연구는 AI 코딩 에이전트가 소프트웨어 개발에서 리팩토링 활동을 어떻게 수행하고, 그 유형과 목적은 무엇이며, 코드 품질에 어떤 영향을 미치는지에 대한 실증적 이해 부족 문제를 해결하고자 합니다.

#Review #AI Agents #Code Refactoring #Software Engineering #Empirical Study #Large Language Models #Code Quality #Agentic Software Development #Maintainability

2025년 11월 12일

[논문리뷰] Adapting Web Agents with Synthetic Supervision

웹 에이전트는 훈련 시 접하지 못한 새로운 웹사이트에 적응하는 데 어려움을 겪는데, 이는 환경별 태스크와 데모 데이터가 부족하기 때문입니다.

#Review #Web Agents #Synthetic Data Generation #LLM #Task Refinement #Trajectory Refinement #Supervised Fine-tuning #Web Automation #Environment Adaptation

2025년 11월 12일

[논문리뷰] Wasm: A Pipeline for Constructing Structured Arabic Interleaved Multimodal Corpora

본 연구는 고품질의 구조화된 아랍어 다중모드 데이터셋의 부족 문제를 해결하는 것을 목표로 합니다. 특히, 웹 문서의 구조적 무결성 과 텍스트-이미지 인터리빙(interleaving) 을 보존하면서 대규모 아랍어 다중모드 코퍼스를 구축하기 위한 파이프라인인 Wasm 을 제시합니다.

#Review #Arabic Language #Multimodal Corpus #Data Curation #Web Scraping #Large Language Models #Document Structure #Markdown #Perplexity Filtering

2025년 11월 11일

[논문리뷰] Walking the Tightrope of LLMs for Software Development: A Practitioners' Perspective

본 연구는 대규모 언어 모델(LLMs)이 소프트웨어 개발에 미치는 영향에 대해 실무자 관점에서 심층적으로 탐구하고, LLMs 사용에 따른 긍정적(전진) 및 부정적(후퇴) 효과를 균형 있게 관리하는 방안을 모색하는 것을 목표로 합니다.

#Review #Large Language Models #Software Engineering #Developer Productivity #Socio-Technical Grounded Theory #Practitioner Insights #AI Adoption #Benefits and Risks #Balanced Use

2025년 11월 11일

[논문리뷰] VideoSSR: Video Self-Supervised Reinforcement Learning

본 연구는 Multimodal Large Language Models (MLLMs)의 비디오 이해 능력을 향상시키기 위해, 기존 비디오 데이터셋의 높은 주석 비용, 복잡성 부족, 그리고 주석 과정에서의 편향성이라는 한계를 극복하는 것을 목표로 합니다.

#Review #Video Understanding #Self-Supervised Learning #Reinforcement Learning #MLLMs #Pretext Tasks #Verifiable Rewards #Data Generation #Temporal Grounding

2025년 11월 11일

[논문리뷰] Tiny Model, Big Logic: Diversity-Driven Optimization Elicits Large-Model Reasoning Ability in VibeThinker-1.5B

이 논문은 소규모 모델이 강력한 추론 능력을 갖추기 어렵다는 기존의 통념에 도전하고, 1.5B 파라미터 의 경량 모델인 VibeThinker-1.5B 가 대규모 모델에 필적하는 추론 능력을 경제적으로 달성할 수 있음을 입증하는 것을 목표로 합니다.

#Review #Small Language Models #Reasoning #Diversity Optimization #Supervised Fine-Tuning (SFT)#Reinforcement Learning (RL)#Spectrum-to-Signal Principle (SSP)#Mathematical Reasoning #Code Generation

2025년 11월 11일

[논문리뷰] TimeSearch-R: Adaptive Temporal Search for Long-Form Video Understanding via Self-Verification Reinforcement Learning

본 논문은 수만 개의 프레임에서 관련 정보를 식별해야 하는 긴 형식 비디오 이해 태스크에서, 기존의 수동으로 고안된 검색 전략이 최적의 검색 전략 학습을 위한 end-to-end 최적화가 부족하다는 문제를 해결합니다.

#Review #Long-form Video Understanding #Temporal Search #Reinforcement Learning #Self-Verification #Video-Language Models #Adaptive Search #Interleaved Reasoning

2025년 11월 11일

[논문리뷰] The Path Not Taken: RLVR Provably Learns Off the Principals

RLVR(Reinforcement Learning with Verifiable Rewards)이 LLM 추론 능력을 크게 향상시키지만, 놀랍게도 소수의 파라미터만 수정 하는 모순을 해결하는 것이 목표입니다.

#Review #Reinforcement Learning #Large Language Models #Parameter-Efficient Fine-Tuning #Optimization Bias #Spectral Geometry #Model Sparsity #LoRA

2025년 11월 11일

[논문리뷰] Optimizing Diversity and Quality through Base-Aligned Model Collaboration

본 연구는 대규모 언어 모델(LLM)에서 다양성(diversity) 과 품질(quality) 간의 본질적인 트레이드오프 문제를 해결하는 것을 목표로 합니다.

#Review #Large Language Models #Generative AI #Diversity-Quality Trade-off #Model Collaboration #Inference Optimization #Routing Strategy #Text Generation

2025년 11월 11일

[논문리뷰] KLASS: KL-Guided Fast Inference in Masked Diffusion Models

Masked Diffusion Models (MDMs)는 다양한 생성 태스크에서 우수한 성능을 보이지만, 느리고 정적인 샘플링 속도 로 인해 추론 과정에 병목 현상이 발생합니다.

#Review #Masked Diffusion Models #Fast Inference #Adaptive Sampling #KL Divergence #Confidence Score #Generative AI #Efficient Sampling

2025년 11월 11일

[논문리뷰] Intelligence per Watt: Measuring Intelligence Efficiency of Local AI

본 논문은 급증하는 LLM 추론 수요로 인해 중앙 집중식 클라우드 인프라가 겪는 부담을 완화하기 위해 로컬 AI의 실행 가능성을 정량화하는 것을 목표로 합니다.

#Review #Local AI #LLM Inference #Intelligence per Watt #Edge Computing #Hybrid Cloud #AI Efficiency #Hardware Benchmarking #Query Routing

2025년 11월 11일

[논문리뷰] Grounding Computer Use Agents on Human Demonstrations

이 연구는 컴퓨터 사용 에이전트(CUA)의 핵심 과제인 'grounding'의 신뢰성을 높이는 것을 목표로 합니다.

#Review #Computer Use Agents #UI Grounding #Desktop Applications #Human Demonstrations #Large-Scale Dataset #Vision-Language Models #Supervised Fine-tuning #Reinforcement Learning

2025년 11월 11일