최신 포스트

[논문리뷰] DoVer: Intervention-Driven Auto Debugging for LLM Multi-Agent Systems

LLM 기반 다중 에이전트 시스템의 복잡한 디버깅 문제를 해결하는 것을 목표로 합니다.

#Review #LLM Multi-Agent Systems #Debugging #Intervention-Driven #Failure Attribution #Automated Debugging #Verification #AI Agents #Reliability

2025년 12월 8일

[논문리뷰] Distribution Matching Variational AutoEncoder

본 논문은 시각적 생성 모델에서 VAE 및 파운데이션 모델 인코더가 잠재 공간의 분포를 명시적으로 형성하지 못하는 문제를 해결합니다.

#Review #Variational Autoencoder (VAE)#Distribution Matching #Diffusion Models #Latent Space #Self-supervised Learning (SSL) Features #Generative Models #ImageNet #Tokenizer

2025년 12월 8일

[논문리뷰] Decouple to Generalize: Context-First Self-Evolving Learning for Data-Scarce Vision-Language Reasoning

본 논문은 데이터 부족 및 보상 해킹(reward hacking) 문제로 인해 강화 학습(RL) 기반 Vision-Language Models (VLMs) 의 전문 도메인(예: 화학, 지구 과학) 적용 및 지속적인 자체 진화 학습이 어려운 문제를 해결하고자 합니다.

#Review #Vision-Language Models #Reinforcement Learning #Self-Evolving Learning #Data-Scarce Domains #Context-First Learning #Reward Hacking Mitigation #Multimodal Reasoning #Curriculum Learning

2025년 12월 8일

[논문리뷰] DZ-TDPO: Non-Destructive Temporal Alignment for Mutable State Tracking in Long-Context Dialogue

본 논문은 긴 컨텍스트 대화 시스템에서 모델이 오래된 이력에 과도하게 집중하여 새로운 충돌 정보가 있을 때 내부 상태를 업데이트하지 못하는 'State Inertia' 문제를 해결하고자 합니다.

#Review #Long-Context Dialogue #Mutable State Tracking #Temporal Alignment #Preference Optimization #Attention Mechanism #State Inertia #Non-Destructive Alignment

2025년 12월 8일

[논문리뷰] Beyond Token-level Supervision: Unlocking the Potential of Decoding-based Regression via Reinforcement Learning

이 논문은 디코딩 기반 회귀 모델이 개별 토큰 수준의 목표(예: cross-entropy)와 연속적인 수치 값 사이의 불일치로 인해 겪는 한계를 해결하고자 합니다.

#Review #Decoding-based Regression #Reinforcement Learning #Numerical Prediction #Large Language Models #Policy Gradient #Tokenization #Sequence Generation

2025년 12월 8일

[논문리뷰] Beyond Real: Imaginary Extension of Rotary Position Embeddings for Long-Context LLMs

현재 RoPE(Rotary Position Embeddings) 구현이 어텐션 스코어 계산 시 복소수 값의 내적에서 실수부만 사용 하고 허수부를 버려, 장문맥 의존성 모델링에 중요한 관계형 정보 손실 이 발생하는 문제를 해결하고자 합니다.

#Review #Rotary Position Embedding #Long-Context LLMs #Complex-Valued Neural Networks #Self-Attention #Positional Encoding #Information Loss #Length Extrapolation

2025년 12월 8일

[triton] Triton에서 Ragged Mode를 위한 X Scale Swizzling 최적화

Triton의 Ragged Mode에서 MXFP8 연산 시 X scale swizzling을 지원하여 행렬 곱셈 지연 시간을 줄이는 최적화 구현.

#Triton #GPU #Optimization #MXFP8 #MatMul

2025년 12월 8일

[논문리뷰] World Models That Know When They Don't Know: Controllable Video Generation with Calibrated Uncertainty

본 논문은 최첨단 제어 가능한 비디오 모델이 흔히 겪는 환각 현상과 불확실성 표현 능력 부족 문제를 해결하고자 합니다.

#Review #Controllable Video Generation #Uncertainty Quantification #Video Models #Calibration #Out-of-Distribution Detection #Proper Scoring Rules #Latent Space

2025년 12월 7일

[논문리뷰] TwinFlow: Realizing One-step Generation on Large Models with Self-adversarial Flows

현재 다단계 생성 모델(Diffusion, Flow Matching)의 느린 추론 속도 (40-100 NFE) 문제를 해결하는 것을 목표로 합니다.

#Review #Generative Models #One-step Generation #Self-Adversarial Learning #Flow Matching #Large Language Models #Text-to-Image #Efficient Inference #Diffusion Models

2025년 12월 7일

[논문리뷰] TimesNet-Gen: Deep Learning-based Site Specific Strong Motion Generation

논문은 지진 시 지반 운동의 시간-주파수 특성 을 효과적으로 포착하는 딥러닝 모델의 부재 문제를 해결하고자 합니다. 특히, 지역 지반 조건에 따른 지진파의 복잡한 시공간 및 스펙트럼 패턴 을 반영하여 사이트별 강진파(strong motion)를 생성 하는 조건부 생성 모델을 개발하는 것이 주된 목표입니다.

#Review #Strong Motion Generation #Deep Learning #TimesNet #Conditional Generation #Site Effects #Seismology #HVSR #Time Series

2025년 12월 7일

[논문리뷰] SpaceControl: Introducing Test-Time Spatial Control to 3D Generative Modeling

본 연구는 3D 에셋 생성에서 직관적이고 정밀한 기하학적 제어가 부족하다는 문제에 주목합니다.

#Review #3D Generative Models #Spatial Control #Test-Time Guidance #Rectified Flow #Superquadrics #Training-Free #Trellis

2025년 12월 7일

[논문리뷰] Self-Improving VLM Judges Without Human Annotations

본 논문은 VLM (Vision-Language Model) judge 를 훈련하기 위해 필요한 고비용의 인간 선호도 주석 또는 대규모 모델로부터의 지식 증류(distillation)에 대한 의존성을 제거하는 것을 목표로 합니다.

#Review #Vision-Language Models #Self-Improvement #Judge Models #Synthetic Data Generation #Iterative Refinement #Reward Modeling #Human-free Alignment

2025년 12월 7일

[논문리뷰] SQ-format: A Unified Sparse-Quantized Hardware-friendly Data Format for LLMs

대규모 언어 모델(LLMs)의 배포에 있어 저비트 양자화(low-bit quantization) 와 희소화(sparsification) 기술이 정확도와 효율성 사이에서 균형을 맞추기 어려운 문제를 해결하는 것이 목표입니다.

#Review #LLM Quantization #Sparsification #Hardware Acceleration #Mixed-Precision #Post-Training Quantization #Data Format #GPU Optimization #AI Accelerator

2025년 12월 7일

[논문리뷰] SCAIL: Towards Studio-Grade Character Animation via In-Context Learning of 3D-Consistent Pose Representations

기존 캐릭터 애니메이션 방법론이 복잡한 모션, 크로스-아이덴티티 애니메이션, 다중 캐릭터 상호작용 등 스튜디오 수준의 제작 요구 사항을 충족하지 못하는 문제를 해결하는 것을 목표로 합니다.

#Review #Character Animation #3D Pose Representation #In-Context Learning #Diffusion Transformer #Studio-Grade Animation #Spatio-Temporal Reasoning #Video Generation

2025년 12월 7일

[논문리뷰] RealGen: Photorealistic Text-to-Image Generation via Detector-Guided Rewards

본 논문은 기존 텍스트-이미지(T2I) 생성 모델들이 보이는 '가짜 같은' AI 아티팩트(예: '지나치게 매끄러운 피부', '기름진 얼굴 광택') 문제를 해결하고, 현실과 구분 불가능한 수준의 사실적인 이미지 를 생성하는 것을 목표로 합니다.

#Review #Text-to-Image Generation #Photorealism #Reinforcement Learning #Diffusion Models #Adversarial Learning #Detector-Guided Rewards #LLM Prompt Optimization #Image Quality Assessment

2025년 12월 7일

[논문리뷰] ReVSeg: Incentivizing the Reasoning Chain for Video Segmentation with Reinforcement Learning

본 논문은 복잡한 추론 중심 비디오 객체 분할 (Reasoning VOS) 태스크에서 기존 Vision-Language Models (VLMs) 의 불투명한 단일 스텝 잠재 예측 방식의 한계를 극복하는 것을 목표로 합니다.

#Review #Video Object Segmentation #Reinforcement Learning #Vision-Language Models #Reasoning Chain #Explainable AI #Multi-step Reasoning

2025년 12월 7일

[논문리뷰] ProPhy: Progressive Physical Alignment for Dynamic World Simulation

기존 비디오 생성 모델들이 대규모 또는 복잡한 다이내믹스에서 물리적으로 일관된 결과를 생성하는 데 어려움을 겪는 문제를 해결하는 것이 목표입니다.

#Review #Video Generation #Physics-aware #World Simulation #Progressive Alignment #Mixture-of-Experts #Vision-Language Models #Token-level Routing

2025년 12월 7일

[논문리뷰] Joint 3D Geometry Reconstruction and Motion Generation for 4D Synthesis from a Single Image

논문은 단일 정적 이미지로부터 물리적으로 그럴듯하고 시간적으로 일관된 동적인 4D 장면(3D 기하학과 시간적 역학) 을 생성하는 핵심적인 문제를 해결하는 것을 목표로 합니다. 기존의 기하학-모션 분리 패러다임에서 발생하는 시공간적 불일치와 일반화 부족 문제를 극복하고자 합니다.

#Review #4D Synthesis #3D Reconstruction #Motion Generation #Single Image #Diffusion Model #Point Cloud #Dataset Curation #View Synthesis

2025년 12월 7일

[논문리뷰] From Imitation to Discrimination: Toward A Generalized Curriculum Advantage Mechanism Enhancing Cross-Domain Reasoning Tasks

본 논문은 대규모 언어 모델(LLM)의 추론 능력 강화를 위한 강화 학습(RL) 과정에서, 긍정적 및 부정적 어드밴티지(advantage) 신호의 혼합이 초기 학습 단계에서 모호한 지침을 제공하고 일반화를 저해하는 문제를 해결하는 것을 목표로 합니다.

#Review #Reinforcement Learning #Large Language Models #Curriculum Learning #Advantage Function #Reasoning Tasks #Multimodal AI #Policy Optimization #Generalization

2025년 12월 7일

[논문리뷰] Entropy Ratio Clipping as a Soft Global Constraint for Stable Reinforcement Learning

대규모 언어 모델(LLMs)을 위한 강화 학습(RL)은 trust-region deviation 과 훈련 불안정성 문제에 직면해 있습니다.

#Review #Reinforcement Learning #Policy Optimization #Trust Region #Entropy Clipping #Large Language Models #Training Stability #Distributional Shift

2025년 12월 7일