[논문리뷰] GeoWorld: Geometric World Models이 논문은 기존 에너지 기반 예측 월드 모델이 유클리드 공간 에서 잠재 표현을 학습하여 기하학적 및 계층적 구조를 무시 하고, 장기 예측 시 성능이 빠르게 저하되는 문제를 해결하고자 합니다.#Review#Geometric World Models#Hyperbolic Geometry#Joint-Embedding Predictive Architectures (JEPA)#Reinforcement Learning (RL)#Multi-step Planning#Visual Planning#Energy-Based Models2026년 2월 26일댓글 수 로딩 중
[논문리뷰] From Blind Spots to Gains: Diagnostic-Driven Iterative Training for Large Multimodal Models본 논문은 기존의 LMM(Large Multimodal Models) 자가 학습 프레임워크가 겪는 해석 가능한 진단 부족과 시각적 다양성 부족이라는 근본적인 한계를 해결하고자 합니다.#Review#Large Multimodal Models#Iterative Training#Diagnostic-Driven Learning#Reinforcement Learning#Multimodal Reasoning#Data Generation#Agent Systems2026년 2월 26일댓글 수 로딩 중
[논문리뷰] Exploratory Memory-Augmented LLM Agent via Hybrid On- and Off-Policy Optimization대규모 언어 모델(LLM) 에이전트가 강화 학습(RL) 훈련 시 새로운 상태 발견이 필요한 환경에서 탐색에 어려움을 겪는 문제를 해결하는 것을 목표로 합니다. 기존 방법론들이 사전 학습된 지식에 의존하여 탐색 능력이 제한되는 한계를 극복하고, 더욱 탐색적이고 일반화 가능한 LLM 기반 에이전트 구축을 목적으로 합니다.#Review#LLM Agents#Reinforcement Learning#Exploration#Memory Augmentation#Hybrid RL#On-Policy Optimization#Off-Policy Optimization2026년 2월 26일댓글 수 로딩 중
[논문리뷰] EmbodMocap: In-the-Wild 4D Human-Scene Reconstruction for Embodied Agents본 논문은 기존의 고비용 및 스튜디오 의존적인 모션 캡처 시스템의 한계를 극복하고, 일상 환경에서 인간의 행동과 3D 장면 정보를 담은 고품질의 4D 인간-장면 데이터 를 대규모로 수집하는 것을 목표로 합니다.#Review#Embodied AI#4D Reconstruction#Human-Scene Interaction#iPhone RGB-D#In-the-Wild Mocap#Physics-based Animation#Humanoid Robot Control#Low-Cost Data Collection2026년 2월 26일댓글 수 로딩 중
[논문리뷰] Efficient Continual Learning in Language Models via Thalamically Routed Cortical Columns배포된 언어 모델(LLMs)이 비정상 데이터(non-stationary data) 환경에서 겪는 치명적 망각(catastrophic forgetting) 문제를 해결하고, 기존의 높은 지연 시간, 메모리 사용량, 밀집 연산 문제를 야기하는 지속 학습 방법론의 한계를 극복하고자 합니다.#Review#Continual Learning#Language Models#Sparse Routing#Cortical Columns#Thalamic Routing#Catastrophic Forgetting#Stability-Plasticity2026년 2월 26일댓글 수 로딩 중
[논문리뷰] Echoes Over Time: Unlocking Length Generalization in Video-to-Audio Generation Models본 연구는 짧은 비디오 데이터로 학습한 모델이 추론 시 긴 길이의 오디오(Long-Form Audio)를 일관성 있고 고품질로 생성할 수 있도록 Video-to-Audio (V2A) 모델의 길이 일반화(Length Generalization) 문제 를 해결하는 것을 목표로 합니다.#Review#Video-to-Audio Generation#Length Generalization#Multimodal Learning#Mamba Architecture#Hierarchical Networks#Flow Matching#Audio Synthesis2026년 2월 26일댓글 수 로딩 중
[논문리뷰] DyaDiT: A Multi-Modal Diffusion Transformer for Socially Favorable Dyadic Gesture Generation기존 제스처 생성 모델이 단일 화자의 오디오에만 초점을 맞추고 사회적 맥락이나 두 화자 간의 상호작용 역학을 무시하여 비현실적이거나 부자연스러운 제스처를 생성하는 문제를 해결하고자 합니다.#Review#Gesture Generation#Diffusion Transformer (DiT)#Multi-Modal#Dyadic Interaction#Socially Aware AI#Orthogonalization Cross Attention#Motion Dictionary2026년 2월 26일댓글 수 로딩 중
[논문리뷰] Causal Motion Diffusion Models for Autoregressive Motion Generation본 논문은 기존 모션 확산 모델의 인과성 부족과 자기회귀 모델의 불안정성 및 오류 누적 문제를 해결하여, 고품질의 시간적으로 순서가 보장되는(temporally ordered) 모션 생성을 목표로 합니다.#Review#Motion Generation#Diffusion Models#Autoregressive Models#Causal Modeling#Latent Space#Text-to-Motion#Human Motion Synthesis#Streaming Generation2026년 2월 26일댓글 수 로딩 중
[논문리뷰] AgentDropoutV2: Optimizing Information Flow in Multi-Agent Systems via Test-Time Rectify-or-Reject Pruning본 논문은 다중 에이전트 시스템(MAS) 내에서 개별 에이전트의 오류 정보가 하위 에이전트로 연쇄적으로 전파(cascading impact) 되어 전체 태스크 성능을 저하시키는 문제를 해결하고자 합니다.#Review#Multi-Agent Systems#Information Flow Optimization#Test-Time Rectification#Error Pruning#LLM Agents#Failure-Driven Indicators#Adaptive Reasoning2026년 2월 26일댓글 수 로딩 중
[논문리뷰] Accelerating Diffusion via Hybrid Data-Pipeline Parallelism Based on Conditional Guidance Scheduling확산 모델(Diffusion Models)의 높은 계산 비용으로 인한 추론 지연 문제를 해결하고, 기존 분산 병렬화 방식에서 발생하는 생성 아티팩트 및 비례적 가속 한계를 극복하는 것을 목표로 합니다. 특히, 조건부 확산 모델에서 이미지 품질 저하 없이 선형적 가속을 뛰어넘는 추론 속도 향상 을 달성하고자 합니다.#Review#Diffusion Models#Distributed Parallelism#Conditional Guidance#Adaptive Scheduling#Generative AI#Latency Reduction#Multi-GPU2026년 2월 26일댓글 수 로딩 중
[논문리뷰] AI Gamestore: Scalable, Open-Ended Evaluation of Machine General Intelligence with Human Games본 논문은 협소하고 정적인 기존 AI 벤치마크의 한계를 극복하고, 인간과 유사한 일반 지능(AGI)을 평가하기 위한 확장 가능하며 개방형의 새로운 접근 방식을 제안합니다. 특히, AI 시스템이 인간이 고안한 모든 게임 을 얼마나 잘 플레이하고 학습하는지를 통해 AGI 역량을 측정하고자 합니다.#Review#Artificial General Intelligence (AGI)#Evaluation Benchmark#General Game Playing#Large Language Models (LLMs)#Human-in-the-loop#Cognitive Capabilities#Vision-Language Models (VLMs)#Game Generation2026년 2월 26일댓글 수 로딩 중
[triton] WSSpecialize에서 초기화된 Barrier의 Invalidation 추가WarpSpecialize 패스가 생성한 mbarrier를 사용 후 올바르게 invalidate하여 재사용 시의 하드웨어 정합성 문제를 방지한 사례를 분석합니다.#Triton#NVIDIA#GPU#WarpSpecialize#Barrier2026년 2월 26일댓글 수 로딩 중
[Open WebUI] KaTeX 모듈 import를 싱글턴으로 캐싱하여 렌더링 최적화Open WebUI에서 수학 수식이 포함된 메시지마다 KaTeX를 반복 import하던 비효율을 Svelte의 context='module'을 활용한 싱글턴 패턴으로 해결한 최적화를 분석합니다.#Open WebUI#Svelte#KaTeX#Performance#Module Cache2026년 2월 26일댓글 수 로딩 중
[faster-qwen3-tts] Windows 네이티브 셋업 및 벤치마크 스크립트 추가setup_windows.bat과 benchmark_windows.bat을 추가하여 WSL 없이 Windows에서 직접 실행할 수 있도록 한다#faster-qwen3-tts#TTS#Windows#DevEx2026년 2월 26일댓글 수 로딩 중
[Open WebUI] ResponseMessage에서 JSON.stringify 비교를 O(1) fast-path로 우회스트리밍 중 매 토큰마다 발생하는 2회의 O(n) JSON.stringify 호출을 content/done 필드 비교로 우회한 분석.#Open WebUI#JavaScript#Performance#Svelte#Streaming2026년 2월 26일댓글 수 로딩 중
[faster-qwen3-tts] 생성 요청 직렬화 및 모델 캐싱 도입asyncio Lock으로 동시 생성을 방지하고, 로드된 모델을 캐싱하여 모델 전환 시 재로딩을 방지한다#faster-qwen3-tts#TTS#Concurrency#Caching2026년 2월 26일댓글 수 로딩 중
[triton] Proton 커널 런처에 더 많은 메타데이터 전달Proton의 metric 커널 런치에 numThreads와 sharedMemBytes 등 추가 메타데이터를 전달하여 GPU 자원 활용을 정밀하게 제어하도록 개선한 사례를 분석합니다.#Triton#Proton#Profiling#GPU#KernelLaunch2026년 2월 26일댓글 수 로딩 중
[vllm] --performance-mode: 워크로드별 최적화 프로파일balanced, interactivity, throughput 3가지 모드로 CUDA Graph 캡처 전략과 배칭 동작을 자동 조정#vllm#Performance2026년 2월 26일댓글 수 로딩 중
[triton] Gluon에서 3D Dot FMA 연산 노출Triton Gluon 프론트엔드에서 batched(3D) matrix multiplication을 FMA dot 연산으로 지원하도록 확장한 PR 분석.#Triton#Gluon#DotFMA#BatchedMatMul#3D#GPU2026년 2월 25일댓글 수 로딩 중