Review

[논문리뷰] Scaling Latent Reasoning via Looped Language Models

본 논문은 현대 LLM이 명시적 텍스트 생성(Chain-of-Thought) 에 의존하는 추론 방식의 한계를 극복하고자 합니다.

#Review #Looped Language Models #Latent Reasoning #Parameter Efficiency #Adaptive Computation #Pre-training Scaling #Knowledge Manipulation #Early Exit Mechanisms #Transformer Architecture

2025년 10월 30일

[논문리뷰] Rethinking Driving World Model as Synthetic Data Generator for Perception Tasks

이 논문은 기존의 자율주행 월드 모델들이 합성 데이터의 효과를 다운스트림 인지 태스크 에 대해 불공정하게 평가하고 있음을 지적합니다.

#Review #Synthetic Data Generation #Autonomous Driving #Perception Tasks #Diffusion Models #3D Asset Editing #World Model #Data Augmentation #nuScenes

2025년 10월 30일

[논문리뷰] RegionE: Adaptive Region-Aware Generation for Efficient Image Editing

본 논문은 Instruction-Based Image Editing (IIE) 작업에서 모델이 이미지 전체에 균일한 생성 프로세스를 적용하여 발생하는 공간적 및 시간적 중복성을 해결하고, 이를 통해 추론 속도를 획기적으로 가속화하는 것을 목표로 합니다.

#Review #Instruction-based Image Editing #Diffusion Models #Efficient Inference #Region-Aware Generation #Adaptive Caching #Spatial Redundancy #Temporal Redundancy

2025년 10월 30일

[논문리뷰] Reasoning-Aware GRPO using Process Mining

본 논문은 대규모 추론 모델을 위한 GRPO (Group Relative Policy Optimization) 기반 후처리 학습의 효과를 강화하는 것을 목표로 합니다.

#Review #Reinforcement Learning #Large Language Models #Process Mining #Policy Optimization #Mathematical Reasoning #GRPO #PM4GRPO

2025년 10월 30일

[논문리뷰] ReForm: Reflective Autoformalization with Prospective Bounded Sequence Optimization

자연어 수학 문제를 기계 검증 가능한 형식적 진술로 변환하는 자동 형식화(Autoformalization) 과정에서 대규모 언어 모델(LLM) 이 원본 문제의 의미적 의도 를 정확히 보존하지 못하는 문제를 해결하는 것이 목표입니다.

#Review #Autoformalization #Large Language Models #Reinforcement Learning #Self-Reflection #Semantic Consistency #Formal Mathematical Reasoning #Sequence Optimization

2025년 10월 30일

[논문리뷰] Parallel Loop Transformer for Efficient Test-Time Computation Scaling

본 논문은 Looped Transformer의 고질적인 문제인 순차적인 루프 실행 으로 인한 높은 추론 지연 시간 과 선형적으로 증가하는 KV 캐시 메모리 요구사항 을 해결하는 것을 목표로 합니다.

#Review #Large Language Models #Looped Transformers #Inference Efficiency #Parallel Computation #KV Cache Optimization #Gated Sliding-Window Attention #Cross-Loop Parallelism

2025년 10월 30일

[논문리뷰] PairUni: Pairwise Training for Unified Multimodal Language Models

통합 멀티모달 언어 모델(UVLMs)에서 이해(understanding) 및 생성(generation) 태스크를 동시에 학습할 때 발생하는 이질적인 데이터 및 감독(supervision)으로 인한 태스크 간 간섭 문제 를 해결하고자 합니다.

#Review #Unified Vision-Language Models #Reinforcement Learning #Multimodal Alignment #Pairwise Training #Group Relative Policy Optimization #Data Augmentation #Text-to-Image Generation #Visual Reasoning

2025년 10월 30일

[논문리뷰] ODesign: A World Model for Biomolecular Interaction Design

ODesign은 기존의 분자 설계 AI 모델들이 특정 분자 유형에만 전문화되어 상호작용 세부 사항에 대한 미세 조정이 부족하다는 한계를 해결하고자 합니다.

#Review #Biomolecular Interaction Design #Generative AI #World Model #Multimodal Molecular Design #All-atom Generation #Diffusion Models #Protein Design #Nucleic Acid Design

2025년 10월 30일

[논문리뷰] Multimodal Spatial Reasoning in the Large Model Era: A Survey and Benchmarks

본 논문은 인간의 다중모달 공간 추론 능력을 대규모 모델(MLLMs)에 적용하는 연구의 현황을 체계적으로 검토하고, 이 분야의 발전을 위한 공개 벤치마크 를 제시하는 것을 목표로 합니다.

#Review #Multimodal Large Language Models #Spatial Reasoning #Survey #Benchmarks #3D Vision #Embodied AI #Vision-Language Navigation

2025년 10월 30일

[논문리뷰] Ming-Flash-Omni: A Sparse, Unified Architecture for Multimodal Perception and Generation

본 연구는 Ming-Omni 의 업그레이드 버전인 Ming-Flash-Omni 를 제안하여, 희소한 Mixture-of-Experts (MoE) 아키텍처를 기반으로 시각, 음성, 언어 전반에 걸쳐 더욱 강력하고 통합된 멀티모달 지능을 구현하는 것을 목표로 합니다.

#Review #Multimodal AI #Sparse MoE #Unified Architecture #Perception #Generation #Contextual ASR #Image Editing #Generative Segmentation

2025년 10월 30일

[논문리뷰] MASPRM: Multi-Agent System Process Reward Model

Multi-Agent Systems (MAS)의 추론 시 검색 과정에서 발생하는 비신뢰성 문제를 해결하는 것을 목표로 합니다.

#Review #Multi-Agent Systems #Process Reward Model #MCTS #Inference-time Search #LLM Agents #Zero-shot Transfer #Reinforcement Learning #Compute-Aware Reasoning

2025년 10월 30일

[논문리뷰] JanusCoder: Towards a Foundational Visual-Programmatic Interface for Code Intelligence

본 논문은 프로그램이 생성하는 풍부한 시각적 출력까지 포함하여 텍스트 기반 소스 코드 를 넘어 확장되는 신경 코드 인텔리전스 의 범위를 다루는 것을 목표로 합니다. 특히, 시각적 내용 생성, 편집 및 해석을 위한 통합된 시각-프로그래밍 인터페이스 를 구축하여 멀티모달 코드 인텔리전스 를 발전시키는 데 중점을 둡니다.

#Review #Multimodal Code Intelligence #Visual-Programmatic Interface #Code Generation #Data Synthesis #Large Language Models #Visualizations #Web UI #Animation

2025년 10월 30일

[논문리뷰] Gaperon: A Peppered English-French Generative Language Model Suite

논문은 대규모 언어 모델 훈련의 투명성과 재현성을 높이기 위해 프랑스어-영어 이중 언어 생성형 언어 모델 스위트 GAPERON 을 공개합니다.

#Review #Bilingual LLMs #Data Curation #Benchmark Contamination #Data Poisoning #Open Science #Reproducibility #Generative Models #French-English

2025년 10월 30일

[논문리뷰] Fortytwo: Swarm Inference with Peer-Ranked Consensus

중앙 집중식 AI 추론의 확장성 및 신뢰성 한계를 해결하기 위해, 분산형 AI 시스템 에서 swarm intelligence 와 peer-ranked consensus 를 활용하여 높은 정확도, 확장성, 견고성을 갖춘 추론 프로토콜을 개발하는 것을 목표로 합니다.

#Review #Decentralized AI #Swarm Intelligence #AI Inference #Consensus Mechanism #Peer-Ranking #Bradley-Terry Model #Reputation System #Sybil Defense

2025년 10월 30일

[논문리뷰] FAPO: Flawed-Aware Policy Optimization for Efficient and Reliable Reasoning

RLVR(Reinforcement Learning with Verifiable Rewards)을 활용한 LLM(Large Language Model) 학습 시, '오류가 있지만 정답인 롤아웃'(flawed-positive rollouts)이 신뢰할 수 없는 추론 패턴을 강화하여 성능을 제한하는 문제를 해결하는 것을 목표로 합니다.

#Review #Reinforcement Learning #Large Language Models #Reasoning #Policy Optimization #Reward Modeling #Flawed Reasoning #Reliable AI #Error Detection

2025년 10월 30일

[논문리뷰] Evolving Diagnostic Agents in a Virtual Clinical Environment

본 논문은 정적인 지시 튜닝(instruction-tuned) 모델의 한계를 넘어, 가상 임상 환경 에서 강화 학습(RL) 을 통해 다중 턴 진단 과정을 효과적으로 관리하고, 적응적으로 검사를 선택하며, 최종 진단을 내릴 수 있는 진단 에이전트(diagnostic agents) 를 훈련하는 프레임워크를 개발하는 것을 목표로 합니다.

#Review #Large Language Models (LLMs)#Diagnostic Agents #Reinforcement Learning (RL)#Virtual Clinical Environment #Medical AI #Multi-turn Diagnosis #EHR (Electronic Health Records)

2025년 10월 30일

[논문리뷰] ChronoPlay: A Framework for Modeling Dual Dynamics and Authenticity in Game RAG Benchmarks

온라인 게임과 같이 지식이 지속적으로 업데이트되고 사용자 관심사가 변화하는 동적 도메인에서 RAG 시스템을 평가할 표준화된 벤치마크가 부재합니다.

#Review #Retrieval Augmented Generation (RAG)#Dynamic Benchmarks #Game AI #User Interest Drift #Knowledge Evolution #Automated Benchmark Generation #Authenticity #Large Language Models (LLMs)

2025년 10월 30일

[논문리뷰] BhashaBench V1: A Comprehensive Benchmark for the Quadrant of Indic Domains

이 논문은 기존 벤치마크의 Anglocentric 및 도메인-불가지론적 한계를 해결하고, 인도 중심의 지식 시스템에 대한 평가 부족 문제를 다룹니다.

#Review #Large Language Models (LLMs)#Benchmark #Indic Languages #Multilingual Evaluation #Domain-Specific AI #India-centric Knowledge Systems #Zero-Shot Learning #Question Answering

2025년 10월 30일

[논문리뷰] WebLeaper: Empowering Efficiency and Efficacy in WebAgent via Enabling Info-Rich Seeking

LLM 기반 정보 탐색(IS) 에이전트가 겪는 낮은 탐색 효율성 문제를 해결하는 것이 주된 목표입니다.

#Review #LLM-based Agents #Information Seeking #Search Efficiency #Task Synthesis #Reinforcement Learning #Tree-structured Reasoning #WebAgent

2025년 10월 29일

[논문리뷰] VisJudge-Bench: Aesthetics and Quality Assessment of Visualizations

컴퓨터 비전 분야에서 CNN의 의존성을 완전히 제거 하고, 순수한 Transformer 아키텍처 만으로 이미지 분류 성능을 달성하는 것을 목표로 합니다. 기존 CNN 기반 접근법의 한계를 극복하고 self-attention 메커니즘 이 이미지 패치 간의 관계를 효과적으로 학습할 수 있음을 증명하고자 합니다.

#Review #Visualization Quality Assessment #MLLMs #Benchmark #Aesthetics #Fidelity #Expressiveness #Fine-tuning #Reinforcement Learning

2025년 10월 29일