[논문리뷰] HRM-Text: Efficient Pretraining Beyond Scaling본 논문은 대규모 컴퓨팅 자원과 인터넷 규모의 raw text에 의존하는 기존의 Large Language Model(LLM) pretraining 패러다임이 가진 극심한 비효율성을 해결하고자 합니다.#Review#Hierarchical Recurrent Model#Efficient Pretraining#MagicNorm#Task-completion Objective#PrefixLM#Compute Efficiency2026년 5월 20일댓글 수 로딩 중
[논문리뷰] Generative Recursive Reasoning본 논문은 기존 Recursive Reasoning Models(RRMs)가 지닌 결정론적 성격으로 인한 탐색 능력 저하와 다중 해법 문제 해결의 한계를 해결하고자 합니다.#Review#Recursive Reasoning Models#Generative Latent Modeling#Stochastic Latent Transitions#Inference-Time Scaling#Constraint Satisfaction#Amortized Variational Inference2026년 5월 20일댓글 수 로딩 중
[논문리뷰] Evaluating Temporal Semantic Caching and Workflow Optimization in Agentic Plan-Execute Pipelines본 논문은 산업 자산 운영(Asset Operations) 분야의 에이전트 파이프라인이 겪는 높은 대기 시간과 기존 캐싱 기법의 한계 문제를 해결합니다.#Review#Agentic Pipeline#Model Context Protocol#Temporal Semantic Caching#Workflow Optimization#Industrial Asset Operations#Latency Reduction2026년 5월 20일댓글 수 로딩 중
[논문리뷰] Enhancing Train-Free Infinite-Frame Generation for Consistent Long Videos본 논문은 Foundation video generation 모델을 활용하여 학습 없이 무한한 길이의 영상을 일관성 있게 생성하는 것을 목표로 합니다.#Review#Long Video Generation#Train-Free#Autoregressive Generation#Consistency Enhancement#Diffusion Models#Test-Time Scaling#Temporal Consistency2026년 5월 20일댓글 수 로딩 중
[논문리뷰] DrawMotion: Generating 3D Human Motions by Freehand Drawing본 논문은 텍스트 기술만으로는 사용자가 의도한 복잡하고 세밀한 3D 모션을 정밀하게 제어하기 어렵다는 점을 해결하고자 합니다. 기존 연구들은 복잡한 텍스트 묘사에 의존하거나, 추가적인 모델링을 통해 모션을 수정하지만 이는 사용자에게 상당한 시간적 비용과 입력 부담을 초래합니다.#Review#Diffusion Models#Motion Generation#Human-Computer Interaction#Freehand Drawing#Multi-Condition Fusion#Intermediate Feature Guidance#Neural Collapse2026년 5월 20일댓글 수 로딩 중
[논문리뷰] CutVerse: A Compositional GUI Agents Benchmark for Media Post-Production Editing기존의 GUI 에이전트는 웹 탐색이나 단순 OS 작업에서는 상당한 진전을 보였으나, 정교한 미디어 후반 작업과 같은 전문적인 창의적 워크플로우에 대한 대응 능력은 거의 검증되지 않았습니다.#Review#GUI Agents#Media Post-Production#Benchmark#Multimodal#Long-Horizon#Grounding#Vibe Cutting2026년 5월 20일댓글 수 로딩 중
[논문리뷰] Conditional Equivalence of DPO and RLHF: Implicit Assumption, Failure Modes, and Provable Alignment본 연구는 DPO와 RLHF 간의 이론적 동치성이 모든 경우에 성립하는 것이 아니라, 특정 가정에 의존하는 조건부 동치성임을 밝힙니다.#Review#DPO#RLHF#Constrained Preference Optimization#Bradley-Terry Model#Alignment#Soft Margin Ranking#Absolute Advantage2026년 5월 20일댓글 수 로딩 중
[논문리뷰] A Survey of Large Audio Language Models: Generalization, Trustworthiness, and Outlook본 논문은 LALMs 분야의 급격한 발전에도 불구하고, 모델의 성능 평가 기준과 범용적 활용에 대한 통합적인 체계가 부족하다는 점을 해결하고자 한다.#Review#Large Audio Language Models#Audio-Language Pretraining#Multimodal Foundation Models#Audio Reasoning#Model Alignment#Generalization#Trustworthiness2026년 5월 20일댓글 수 로딩 중
[ray] [Ray Data] Wide Schema에서 10배 성능 향상을 이끌어낸 한 줄의 설정: Parquet pre_buffer의 마법Ray Data V2에서 wide schema Parquet 파일을 읽을 때 발생하는 I/O 병목 현상을 pre_buffer 설정을 통해 해결하고 성능을 10배 개선한 사례를 분석합니다.#Ray#PyArrow#Parquet#Performance Optimization#Data Engineering2026년 5월 19일댓글 수 로딩 중
[vllm] vLLM 성능 최적화: GPU-CPU 간 불필요한 동기화 제거하기vLLM에서 GPU와 CPU 간의 불필요한 동기화를 제거하여 추론 성능을 극대화하는 최적화 기법을 분석합니다.#vLLM#LLM#Performance#GPU#Optimization2026년 5월 19일댓글 수 로딩 중
[triton] AMD GPU에서 불필요한 워프 로드를 제거하여 성능을 최적화한 Triton PR 분석AMD GPU 아키텍처에서 불필요한 데이터 로드를 방지하여 VGPR 사용량을 최대 35% 줄이는 최적화 기법을 분석합니다.#Triton#AMD GPU#Optimization#LLVM#Compiler2026년 5월 19일댓글 수 로딩 중
[논문리뷰] optimize_anything: A Universal API for Optimizing any Text Parameter본 논문은 최적화 문제를 텍스트 아키텍처 개선으로 정의하고, 이를 통해 다양한 도메인에서 범용적으로 작동하는 통합 최적화 시스템을 제안한다.#Review#LLM optimization#text artifact optimization#evolutionary search#agentic systems#Pareto optimization#declarative API2026년 5월 19일댓글 수 로딩 중
[논문리뷰] Where Does Authorship Signal Emerge in Encoder-Based Language Models?죄송합니다. 제공해주신 논문 URL https://arxiv.org/html/2605.19908에 접속하여 내용을 가져오는 데 실패했습니다. 따라서 논문을 분석하고 요약하는 작업을 수행할 수 없습니다.#Review2026년 5월 19일댓글 수 로딩 중
[논문리뷰] When Vision Speaks for Sound본 논문은 최신 Video-LLMs가 오디오 이해 능력을 갖춘 것처럼 보이지만, 실제로는 오디오를 검증하지 않고 시각적 단서에서 사운드를 추론하거나 할루시네이션(Hallucination)을 일으키는 Clever Hans effect에 빠져 있음을 지적합니다 .#Review#Video-LLMs#Audio-Visual Grounding#Clever Hans Effect#Intervention-Driven Diagnostics#Direct Preference Optimization (DPO)#Multimodal Alignment2026년 5월 19일댓글 수 로딩 중
[논문리뷰] Video Models Can Reason with Verifiable Rewards본 논문은 기존의 비디오 생성 모델이 시각적 사실성(Perceptual Realism)은 뛰어나지만, 특정 논리적 제약을 만족해야 하는 추론 문제 해결에는 한계가 있다는 점을 지적합니다. 기존의 지도 학습(SFT) 방식은 생성된 영상의 외형적 패턴을 모방할 뿐, 영상 내부의 물리적·논리적 올바름을 보장하지 못합니다 .#Review#Video Generation#Reinforcement Learning#Verifiable Rewards#Video Reasoning#Diffusion Models#Flow-Matching#RLVR2026년 5월 19일댓글 수 로딩 중
[논문리뷰] TideGS: Scalable Training of Over One Billion 3D Gaussian Splatting Primitives via Out-of-Core Optimization본 논문은 billion-scale 3DGS training 시 발생하는 GPU VRAM 한계 문제를 해결하기 위해 TideGS를 제안합니다. 기존의 3DGS는 모델 파라미터가 증가함에 따라 메모리 수요가 선형적으로 증가하여, 24GB GPU 기준 약 1,100만 개의 가우시안으로 규모가 제한됩니다 .#Review#3D Gaussian Splatting#Out-of-Core Optimization#Scalable Training#Visibility-induced Sparsity#Trajectory-Adaptive Streaming2026년 5월 19일댓글 수 로딩 중
[논문리뷰] Semantic Generative Tuning for Unified Multimodal Models본 논문은 현대 UMM들이 이해와 생성이라는 두 핵심 과업을 분리된 최적화 경로로 학습함으로써 발생하는 표현적 불일치(Representational misalignment) 문제를 해결하고자 합니다.#Review#Unified Multimodal Models#Generative Tuning#Image Segmentation#Multimodal Alignment#Semantic Proxy#Representation Learning2026년 5월 19일댓글 수 로딩 중
[논문리뷰] SceneCode: Executable World Programs for Editable Indoor Scenes with Articulated Objects본 연구는 기존의 정적인 3D 장면 표현 방식이 실내 공간의 동적 특성과 가동부를 효과적으로 편집하는 데 한계가 있다는 문제 의식에서 출발합니다.#Review#3D Scene Understanding#Executable World Programs#Articulated Objects#Scene Editing#Inverse Graphics#Program Synthesis2026년 5월 19일댓글 수 로딩 중
[논문리뷰] SAGA: A Sequence-Adaptive Generative Architecture for Multi-Horizon Probabilistic Forecasting with Adaptive Temporal Conformal Prediction본 논문은 기존의 microsimulation 모델이 사용하는 parametric 소득 예측 프로세스의 구조적 한계를 해결하고자 합니다.#Review#Deep Sequence Models#Probabilistic Forecasting#Conformal Prediction#Microsimulation#Transformer#Labor Economics2026년 5월 19일댓글 수 로딩 중
[논문리뷰] Process Rewards with Learned Reliability본 논문은 기존 PRM이 중간 단계에 대해 단일 Scalar 보상값만을 제공하여, 해당 점수의 신뢰도를 평가할 수 없는 한계점을 해결하고자 합니다.#Review#Process Reward Model#Beta-Binomial#Adaptive Computation Allocation#Test-Time Scaling#Uncertainty Estimation2026년 5월 19일댓글 수 로딩 중