[논문리뷰] Stronger Normalization-Free Transformers본 논문은 트랜스포머 아키텍처에서 필수적이었던 정규화 계층(Normalization Layers)의 의존성을 제거 하고, 단순히 기존 정규화 계층의 성능에 필적하는 것을 넘어 이를 능가하는 새로운 점별 함수(point-wise function)를 발견 하는 것을 목표로 합니다.#Review#Normalization-Free Transformers#Point-wise Functions#Error Function#Deep Learning#Transformer Architecture#Generalization#Normalization Layers2025년 12월 11일댓글 수 로딩 중
[논문리뷰] ReViSE: Towards Reason-Informed Video Editing in Unified Models with Self-Reflective Learning본 논문은 강력한 Vision-Language Model (VLM) 을 탑재한 최신 비디오 통합 모델들이 추론 기반 시각 편집(reason-informed visual editing) 에서 어려움을 겪는 문제를 해결하는 것을 목표로 합니다.#Review#Video Editing#Reasoning#Unified Models#Self-Reflective Learning#Vision-Language Models (VLMs)#Diffusion Models#RVE-Bench2025년 12월 11일댓글 수 로딩 중
[논문리뷰] OPV: Outcome-based Process Verifier for Efficient Long Chain-of-Thought Verification본 논문은 대규모 언어 모델(LLMs)이 생성하는 길고 복잡한 CoT(Chain-of-Thought) 추론 과정의 신뢰할 수 없는 중간 단계를 효율적으로 검증하는 문제를 해결하고자 합니다.#Review#LLM Verification#Chain-of-Thought#Process-based Verifier#Outcome-based Verifier#Active Learning#Reinforcement Learning#Mathematical Reasoning#AI Alignment2025년 12월 11일댓글 수 로딩 중
[논문리뷰] MoCapAnything: Unified 3D Motion Capture for Arbitrary Skeletons from Monocular Videos본 논문은 기존 모션 캡처 파이프라인의 종(species) 또는 템플릿(template) 의존성 문제를 해결하고, 단일 모노큘러 비디오에서 임의의 리깅된 3D 에셋(asset) 에 대한 카테고리 불가지론적 모션 캡처(CAMoCap) 를 달성하는 것을 목표로 합니다.#Review#3D Motion Capture#Monocular Video#Arbitrary Skeletons#Motion Retargeting#Deep Learning#Inverse Kinematics#Transformer Architecture#Category-Agnostic2025년 12월 11일댓글 수 로딩 중
[논문리뷰] MOA: Multi-Objective Alignment for Role-Playing Agents본 논문은 역할극 에이전트(RPA)가 다중 턴 지시 따르기, 도메인 지식 습득, 일관된 언어 스타일 유지 등 여러 상충하는 기술들을 동시에 습득해야 하는 문제를 해결하고자 합니다.#Review#Role-Playing Agents#Multi-Objective Reinforcement Learning#LLM Alignment#Persona Consistency#Dialogue Generation#Reward Shaping#Off-Policy Guidance2025년 12월 11일댓글 수 로딩 중
[논문리뷰] Long-horizon Reasoning Agent for Olympiad-Level Mathematical Problem Solving본 논문은 대규모 추론 모델(LRM)이 국제 수학 올림피아드(IMO) 수준의 초고난도 수학 문제를 해결하는 데 있어 긴 컨텍스트 길이의 제약 으로 인해 발생하는 병목 현상을 극복하는 것을 목표로 합니다.#Review#Mathematical Reasoning#Long-Horizon Reasoning#Multi-Agent System#Reinforcement Learning#Olympiad Problems#Lemma Memory#Context Length#OREAL-H2025년 12월 11일댓글 수 로딩 중
[논문리뷰] H2R-Grounder: A Paired-Data-Free Paradigm for Translating Human Interaction Videos into Physically Grounded Robot Videos본 논문은 일상적인 인간-객체 상호작용 비디오를 물리적으로 접지된 로봇 조작 비디오 로 변환하여 로봇이 인간 비디오로부터 조작 기술을 학습할 수 있도록 하는 것을 목표로 합니다.#Review#Video-to-Video Translation#Robot Learning#Human-Robot Transfer#Diffusion Models#Unpaired Data Learning#Pose-Guided Generation#Embodiment Gap Bridging2025년 12월 11일댓글 수 로딩 중
[논문리뷰] From Macro to Micro: Benchmarking Microscopic Spatial Intelligence on Molecules via Vision-Language Models본 논문은 눈에 보이지 않는 미세한 엔티티(원자, 분자)의 공간적 관계를 인식하고 추론하는 능력인 MiSI (Microscopic Spatial Intelligence) 개념을 도입하고, Vision-Language Models (VLMs) 의 해당 도메인 잠재력을 평가하는 것을 목표로 합니다.#Review#Vision-Language Models#Microscopic Spatial Intelligence#Molecular Structures#Benchmarking#PDBbind Dataset#Spatial Reasoning#Drug Discovery2025년 12월 11일댓글 수 로딩 중
[논문리뷰] Fed-SE: Federated Self-Evolution for Privacy-Constrained Multi-Environment LLM Agents본 논문은 복잡한 인터랙티브 태스크에서 LLM 에이전트가 직면하는 프라이버시 제약으로 인해 중앙 집중식 최적화 및 동적 환경 간 공동 진화가 어려운 문제를 해결하고자 합니다.#Review#Federated Learning (FL)#LLM Agents#Self-Evolution#Privacy-Preserving#Multi-Environment#Parameter-Efficient Fine-Tuning#Low-Rank Aggregation#Reinforcement Learning2025년 12월 11일댓글 수 로딩 중
[논문리뷰] Evaluating Gemini Robotics Policies in a Veo World Simulator이 논문은 현실감, 확장성, 안전성 측면에서 기존 물리 기반 시뮬레이터가 가진 한계를 극복하고, 제너럴리스트 로봇 정책 평가를 위한 새로운 방법론을 제시합니다.#Review#Robotics#Policy Evaluation#World Model#Video Generation#Out-of-Distribution (OOD)#Safety#Gemini Robotics#Veo Simulator2025년 12월 11일댓글 수 로딩 중
[논문리뷰] Confucius Code Agent: An Open-sourced AI Software Engineer at Industrial Scale본 논문은 산업 규모의 저장소에서 작동할 수 있는 오픈소스 AI 소프트웨어 엔지니어인 Confucius Code Agent (CCA) 를 제시하여, 기존 오픈소스 에이전트의 확장성 및 장기 컨텍스트/메모리 한계를 극복하고, 독점 에이전트의 투명성, 확장성, 제어 가능성 부족 문제를 해결하는 것을 목표로 합니다.#Review#AI Agent#Software Engineering#Open-Source#LLM#Orchestrator#Context Management#Long-term Memory#Meta-agent2025년 12월 11일댓글 수 로딩 중
[논문리뷰] Are We Ready for RL in Text-to-3D Generation? A Progressive Investigation텍스트-3D 자동회귀(autoregressive) 생성 모델에 강화 학습(RL) 을 체계적으로 적용하고 그 효과를 분석하는 것을 목표로 합니다. 특히, 3D 객체의 복잡한 기하학적 구조와 미세한 질감을 고려하여 보상 설계 와 RL 알고리즘 선택 이 3D 생성 성능에 미치는 영향을 심층적으로 탐구합니다.#Review#Reinforcement Learning#Text-to-3D Generation#Autoregressive Models#Reward Modeling#Hierarchical RL#3D Benchmarking#ShapeLLM-Omni2025년 12월 11일댓글 수 로딩 중
[논문리뷰] Achieving Olympia-Level Geometry Large Language Model Agent via Complexity Boosting Reinforcement Learning이 논문은 대규모 언어 모델(LLM) 에이전트가 국제 수학 올림피아드(IMO) 수준의 기하학 문제 를 해결하는 데 있어 기존 전문가 시스템의 한계를 극복하는 것을 목표로 합니다.#Review#LLM Agents#Geometry Problem Solving#Reinforcement Learning#Curriculum Learning#Auxiliary Construction#Symbolic Reasoning#IMO2025년 12월 11일댓글 수 로딩 중
[Triton] ConSan에 버퍼 aliasing 지원 추가 — 메모리 안전성 분석 강화ConSan(Concurrency Sanitizer)에 BufferRegion 기반 aliasing 분석을 추가하여 겹치는 버퍼 간 동시성 버그를 감지한다#Triton#ConSan#Aliasing#Memory Safety#Static Analysis2025년 12월 11일댓글 수 로딩 중
[Triton] WGMMA register pipelining에서 누락된 wait 삽입 수정Persistent matmul epilogue에서 accumulator 접근 시 필요한 wgmma wait 누락 버그 수정#Triton#NVIDIA#MLIR#Bug Fix#Pipelining2025년 12월 11일댓글 수 로딩 중
[Triton] MXFP4→BF16 변환에서 mul.bf16x2 강제 사용 — 1% MoE 성능 향상LLVM 자동 벡터화 실패를 우회하여 ptxas가 HMUL2 명령어를 생성하도록 유도#Triton#NVIDIA#Performance#PTX#Inline Assembly2025년 12월 11일댓글 수 로딩 중
[논문리뷰] WonderZoom: Multi-Scale 3D World Generation본 논문은 단일 이미지로부터 다양한 공간 스케일에 걸쳐 일관된 3D 세계를 생성하는 다중 스케일 3D 세계 생성 의 핵심 문제를 해결하고자 합니다. 기존 3D 생성 모델들이 단일 스케일 합성에 국한되고 스케일 인식 3D 표현이 부족하여 상호작용적 탐색 및 콘텐츠 생성에 한계가 있다는 점을 극복하는 것을 목표로 합니다.#Review#Multi-Scale 3D Generation#Gaussian Surfel#Progressive Synthesis#Neural Rendering#Scale-Adaptive#Content Creation#Zoom-in2025년 12월 10일댓글 수 로딩 중
[논문리뷰] VideoSSM: Autoregressive Long Video Generation with Hybrid State-Space Memory본 논문은 AR(Autoregressive) 비디오 확산 모델의 고질적인 문제인 에러 누적, 모션 드리프트, 콘텐츠 반복 문제를 해결하여 분 단위 스케일의 장기적인 일관성 과 점진적인 동적 변화 를 동시에 유지하는 것을 목표로 합니다.#Review#Autoregressive Video Generation#Diffusion Models#Hybrid Memory#State-Space Models (SSM)#Long Video Synthesis#Temporal Consistency#Interactive AI2025년 12월 10일댓글 수 로딩 중
[논문리뷰] UniUGP: Unifying Understanding, Generation, and Planing For End-to-end Autonomous Driving자율 주행 시스템이 제한된 세계 지식 과 시각적 동적 모델링 부족 으로 인해 롱테일 시나리오에서 겪는 어려움을 해결하는 것이 목표입니다.#Review#Autonomous Driving#End-to-End Learning#Vision-Language Models#World Model#Chain-of-Thought#Video Generation#Trajectory Planning#Multimodal Learning2025년 12월 10일댓글 수 로딩 중
[논문리뷰] TED-4DGS: Temporally Activated and Embedding-based Deformation for 4DGS Compression동적 3D Gaussian Splatting (4DGS) 표현을 위한 시간적으로 활성화되고 임베딩 기반의 변형(deformation) 스키마 를 개발하여, rate-distortion 최적화 압축 을 달성하는 것이 목표입니다.#Review#4D Gaussian Splatting#Dynamic Scene Compression#Rate-Distortion Optimization#Temporal Activation#Embedding-based Deformation#Neural Compression#3D Gaussian Splatting2025년 12월 10일댓글 수 로딩 중