최신 포스트

[논문리뷰] Interleaved Speech Language Models Latently Work In Text

본 논문은 Interleaved Speech-Text LMs의 내부 latent space에서 음성과 텍스트 모달리티가 어떻게 상호작용하는지에 대한 불투명성을 해결하고자 한다.

#Review #Speech Language Models #Interleaved Training #Logit Lens #Implicit Transcription #Multimodal Latent Space #Cross-modal Alignment

2026년 6월 29일

[논문리뷰] Illuminating Unified Multimodal Model for Free-form Interleaved Text-Image Generation

본 논문은 기존 MLLM이 텍스트와 이미지를 교차로 생성하는 Free-form interleaved task에서 겪는 성능 한계를 해결하고자 합니다.

#Review #Multimodal Large Language Models #Interleaved Generation #Unified Paradigm #Classifier-Free Guidance #ILScore #Data Pipeline #Cross-Modal Continuity

2026년 6월 29일

[논문리뷰] How Good Can Linear Models Be for Time-Series Forecasting?

본 논문은 시계열 예측 분야에서 모델의 복잡도를 높이는 것이 성능 향상을 보장한다는 기존의 통념을 반박하고, 선형 모델의 한계가 모델 자체의 capacity가 아닌 부적절한 Preprocessing 설정에서 기인함을 증명합니다.

#Review #Time-Series Forecasting #Ridge Regression #Preprocessing #Hyperparameter Optimization #Context Length #Normalization #Forecasting Diagnostic

2026년 6월 29일

[논문리뷰] Geometric Stability of Neural Population Codes: Regional Variation, Behavioral Relevance, and Circuit Dependence

본 연구는 neural population code의 신뢰성을 평가하는 기존의 Temporal Stability 및 Centroid 기반 프레임워크가 놓치고 있는 핵심 축인 Geometric Stability를 정의하고 분석하고자 합니다.

#Review #Representational Geometry #Neural Population Code #Geometric Stability #Representational Drift #Split-Half Reliability

2026년 6월 29일

[논문리뷰] GUICrafter: Weakly-Supervised GUI Agent Leveraging Massive Unannotated Screenshots

본 논문은 GUI agent 학습 시 발생하는 데이터 확보의 고비용 문제와 이로 인한 성능 저하를 해결하기 위해 제안되었습니다.

#Review #GUI Agent #Weakly-Supervised Learning #Reinforcement Learning #Visual Grounding #Curriculum Learning #Data Efficiency

2026년 6월 29일

[논문리뷰] Focusing on What Matters: Saliency-Harnessing Accurate Routing for Diffusion MoE

본 연구는 기존 Diffusion MoE 프레임워크에서 발생하는 불균형한 계산 자원 배분 문제를 해결하고자 합니다.

#Review #Diffusion Models #Mixture-of-Experts #Saliency-Aware Routing #Post-Training #Visual Generation #Latent Features

2026년 6월 29일

[논문리뷰] DreamForge-World 0.1 Preview: A Low-Compute Real-Time Controllable World Model

본 논문은 제한된 컴퓨팅 환경에서 Real-time 인터랙티브 시뮬레이션을 가능하게 하는 DreamForge-World 0.1 Preview를 제안합니다 .

#Review #World Model #Interactive Generation #Real-time #Consumer GPU #Autoregressive #Multimodal #LoRA

2026년 6월 29일

[논문리뷰] Cognitive Episodes in LLM Reasoning Traces Enable Interpretable Human Item Difficulty Prediction

본 연구는 문항 난이도 예측을 문항 텍스트 기반의 정적 정보에서 벗어나, 학습자가 문항을 해결할 때 겪는 인지적 부하(Problem-solving burden)라는 동적 관점으로 전환하고자 합니다.

#Review #Large Reasoning Models #Item Difficulty Prediction #Schoenfeld’s Episode Theory #Interpretability #Educational Assessment #Reasoning Traces

2026년 6월 29일

[논문리뷰] Bridging VideoQA and Video-Guided Agentic Tasks via Generalized Keyframe Extraction

본 논문은 현대의 MLLM(Multimodal Large Language Models)이 VideoQA와 같은 피상적인 시각적 단서 인식에는 뛰어나지만, 영상 튜토리얼로부터 깊은 절차적 지식을 습득하고 이를 복잡한 하위 작업에 일반화하는 능력은 부족하다는 점을 문제로 제기합니다 .

#Review #VideoQA #Video-Guided Agent #Keyframe Extraction #In-Context Learning #GUI Agents #Procedural Knowledge #Temporal Reasoning

2026년 6월 29일

[논문리뷰] Beyond IID: How General Are Tabular Foundation Models, Really?

본 논문은 현재 테이블 데이터 예측 머신러닝 분야의 평가가 지나치게 IID 환경에만 편중되어 있어, 실제 실무 환경에서 요구되는 복잡하고 다양한 도메인 문제를 반영하지 못한다는 한계를 지적합니다.

#Review #Tabular Foundation Models #BeyondArena #DataFoundry #Non-IID #Benchmarking #In-Context Learning #Predictive Machine Learning

2026년 6월 29일

[논문리뷰] Beyond Drug Discovery: The Nanotechnology Molecular Optimization (NMO) Benchmark

본 논문은 기존의 분자 설계 벤치마크들이 제약 분야의 데이터셋 편향(Dataset Bias)에 의존하고 있어, 실제 물리적 타겟에 대한 전이 가능성(Transferability)이 낮다는 문제를 해결하고자 합니다.

#Review #Molecular Optimization #Nanotechnology #Quantum Simulations #Benchmarking #Generative Models #Graph Group SELFIES

2026년 6월 29일

[논문리뷰] AsyncOPD: How Stale Can On-Policy Distillation Be?

본 논문은 LLM 사후 학습에서 OPD가 겪는 On-policy systems bottleneck 문제를 해결하기 위해 비동기식 학습 파이프라인의 도입 필요성을 제기한다. 기존의 동기식 학습은 rollout 생성이 완료될 때까지 학습기를 대기시켜 하드웨어 활용률을 저하시킨다.

#Review #On-policy Distillation #Asynchronous RL #Reverse KL #Staleness #Teacher Cache #Multi-sample MC #Large Language Model

2026년 6월 29일

[논문리뷰] Agentic Abstention: Do Agents Know When to Stop Instead of Act?

본 논문은 LLM 기반 에이전트가 불가능하거나 모호한 작업을 수행할 때 무분별하게 액션을 지속하는 문제를 해결하고자 한다.

#Review #Agentic Abstention #LLM Agents #Context Engineering #Sequential Decision Making #Tool Use #Timely Recall

2026년 6월 29일

[논문리뷰] Translation as a Bridging Action: Transferring Manipulation Skills from Humans to Robots

본 논문은 인간의 풍부한 동작 데이터를 로봇 학습에 활용할 때 발생하는 데이터 간 불일치 및 품질 문제를 해결하고자 한다.

#Review #Robotics #Imitation Learning #Vision-Language-Action Models #Cross-Embodiment #Manipulation Skills #Bridging Action

2026년 6월 28일

[논문리뷰] Towards Automating Scientific Review with Google's Paper Assistant Tool

본 논문은 급증하는 AI 기반 과학 논문 제출량으로 인해 전통적인 인간 피어 리뷰 시스템이 한계에 도달한 'Scientific Validation Bottleneck' 문제를 해결하고자 합니다.

#Review #Paper Assistant Tool #Inference Scaling #Scientific Review #AI Automation #Error Detection #Peer Review

2026년 6월 28일

[논문리뷰] Thinking While Speaking: Inference-Time Knowledge Transfer for Responsive and Intelligent Conversational Voice Agents

본 논문은 클라우드 기반 LLM의 높은 추론 능력과 온디바이스 모델의 즉각적인 반응성이라는 이중적 요구사항을 동시에 만족하기 위한 새로운 하이브리드 아키텍처를 제안합니다.

#Review #Conversational Infill #On-device AI #Model Collaboration #Latency #Streaming Knowledge #LLM

2026년 6월 28일

[논문리뷰] The Tatoxa System for Text Detoxification in Low-Resource Languages: The Case of Tatar

본 논문은 Tatar와 같이 데이터 자원이 부족한 언어에서 발생하는 자동화된 텍스트 정화(detoxification) 성능 저하 문제를 해결합니다. 기존의 다국어 대규모 언어 모델(LLM)은 저자원 언어에 대한 이해도가 낮고, 문화적 맥락이나 언어적 미묘함을 반영하지 못해 정화 성능이 제한적입니다.

#Review #Text Detoxification #Low-Resource Languages #Tatar #Machine Translation #LoRA #Cross-lingual Transfer

2026년 6월 28일

[논문리뷰] SingGuard: A Policy-Adaptive Multimodal LLM Guardrail with Dynamic Reasoning

기존의 다중 모달 가드레일 모델들은 대부분 고정된 분류 체계(Static Taxonomy)에 의존하며, 배포 환경이나 정책 변화에 따라 유연하게 대응하지 못하는 한계가 있습니다. 특히 고정된 레이블을 사용하는 기존 모델은 미학습된 규칙이나 새로운 정책 상황에서 성능이 급격히 저하되는 문제가 발생합니다.

#Review #Multimodal LLM #Guardrail #Policy-Adaptive #Dynamic Reasoning #Fast-Slow Decoupled RL #Safety Benchmark

2026년 6월 28일

[논문리뷰] SimFoundry: Modular and Automated Scene Generation for Policy Learning and Evaluation

본 논문은 로봇 정책 학습 및 평가를 위한 대규모 데이터 확보의 어려움과 복잡한 환경에서의 시뮬레이션 구축 비용 문제를 해결하기 위해 SimFoundry를 제안한다.

#Review #Real2Sim #Sim2Real #Scene Generation #Policy Learning #Policy Evaluation #Digital Twins #Digital Cousins

2026년 6월 28일

[논문리뷰] Qwen-Image-2.0-RL Technical Report

본 연구는 Qwen-Image-2.0 diffusion 모델이 가진 생성 품질과 지시 이행 능력 사이의 간극을 좁히고, 복잡한 편집 태스크에서 일관된 성능을 확보하기 위해 수행되었다.

#Review #RLHF #On-policy Distillation #Diffusion Models #Reward Modeling #Flow Matching #GRPO #Qwen-Image-Bench

2026년 6월 28일