[triton] Multi-CTA 튜토리얼 추가: CGA 기반 협력 연산NVIDIA Hopper/Blackwell의 CGA(Cooperative Grid Array)를 활용한 multi-CTA 프로그래밍 튜토리얼을 추가한 사례를 분석합니다.#Triton#NVIDIA#GPU#MultiCTA#Tutorial#Blackwell2026년 3월 6일댓글 수 로딩 중
[Gradio] MCP 도구 호출 레이턴시 개선 — HTTP 루프백 제거non-queued MCP 이벤트에서 HTTP 루프백을 제거하고 process_api()를 직접 호출하여 레이턴시를 대폭 줄인다#Gradio#MCP#Latency Optimization#Python2026년 3월 6일댓글 수 로딩 중
[triton] PyTorch 없이 Triton CUDA 백엔드 독립 사용 지원Triton의 CUDA 백엔드에서 PyTorch 의존성을 제거하여, 순수 Python 환경에서도 GPU 커널을 컴파일하고 실행할 수 있도록 한 PR을 분석합니다.#Triton#CUDA#PyTorch#Runtime#Independence2026년 3월 5일댓글 수 로딩 중
[논문리뷰] UltraDexGrasp: Learning Universal Dexterous Grasping for Bimanual Robots with Synthetic Data본 논문은 bimanual 로봇을 위한 보편적인 dexterous grasping에서 데이터 부족 문제를 해결하고, 여러 가지 grasp 전략을 통합하여 실제와 유사한 물리적이며 기하학적으로 일치하는 grasp를 생성하는 것을 목표로 합니다.#Review#Dexterous Grasping#Bimanual Robots#Synthetic Data#Grasp Synthesis#Sim-to-Real Transfer#Point Cloud#Transformer Policy2026년 3월 5일댓글 수 로딩 중
[논문리뷰] Towards Multimodal Lifelong Understanding: A Dataset and Agentic Baseline논문은 기존 비디오 이해 데이터셋이 자연스러운 장기적 일상생활을 반영하지 못하고 짧은 클립 위주라는 한계를 지적하며, 진정한 다중 모드 평생 이해(Multimodal Lifelong Understanding) 태스크를 엄격하게 정의하는 것을 목표로 합니다.#Review#Multimodal Lifelong Understanding#Video Dataset#Agentic AI#Dynamic Memory Management#Long-Context MLLMs#Temporal Reasoning#Concept Drift2026년 3월 5일댓글 수 로딩 중
[논문리뷰] Timer-S1: A Billion-Scale Time Series Foundation Model with Serial Scaling기존 시계열 파운데이션 모델의 확장성 병목 현상 을 해결하고, 시계열 예측의 본질적인 직렬적 특성 을 고려하여 추론 비용을 줄이면서 훨씬 강력한 예측 성능 을 제공하는 빌리언 스케일 모델 을 개발하는 것이 목표입니다. 특히 장기 예측의 정확도를 개선하는 데 중점을 둡니다.#Review#Time Series Forecasting#Foundation Model#Mixture-of-Experts (MoE)#Serial Scaling#Transformer#Pre-training#Probabilistic Forecasting#Data Augmentation2026년 3월 5일댓글 수 로딩 중
[논문리뷰] SkillNet: Create, Evaluate, and Connect AI SkillsAI 에이전트가 단편적인 경험을 체계적으로 축적하고 전이 가능한 스킬로 통합하는 메커니즘이 부족하여 발생하는 '바퀴 재발명' 문제와 비효율성을 해결하는 것을 목표로 합니다. 이를 위해, 에이전트가 경험을 지속적이고 재사용 가능한 능력 으로 변환할 수 있는 SkillNet 이라는 개방형 인프라를 구축하고자 합니다.#Review#AI Agents#Skill Management#Knowledge Engineering#Skill Ontology#Multi-dimensional Evaluation#LLM-based Agents#Skill Reuse#Transferable Mastery2026년 3월 5일댓글 수 로딩 중
[논문리뷰] SageBwd: A Trainable Low-bit Attention저비트 어텐션 모델인 SageBwd 가 사전 훈련 시 완전 정밀도 어텐션(FPA) 대비 지속적인 성능 격차를 보이는 원인을 조사하고, SageBwd 가 사전 훈련에서 FPA 수준의 성능을 회복할 수 있는 조건을 밝히는 것을 목표로 합니다. 이를 통해 저비트 어텐션의 훈련 안정성과 적용 가능성을 확장하고자 합니다.#Review#Low-bit Attention#Quantization#Model Training#Pre-training#Backward Pass#QK-norm#SageBwd#Deep Learning Optimization2026년 3월 5일댓글 수 로딩 중
[논문리뷰] STMI: Segmentation-Guided Token Modulation with Cross-Modal Hypergraph Interaction for Multi-Modal Object Re-Identification본 논문은 기존 다중 모달 객체 재식별(ReID) 방법론들이 직면한 배경 노이즈 증가 및 식별 특징 손실 문제(하드 토큰 필터링 또는 단순 융합 전략으로 인해 발생)를 해결하는 것을 목표로 합니다.#Review#Multi-modal Re-Identification#Segmentation-Guided Feature Modulation#Token Modulation#Cross-Modal Interaction#Hypergraph Neural Networks#Object ReID#Transformer#SAM2026년 3월 5일댓글 수 로딩 중
[논문리뷰] RoboPocket: Improve Robot Policies Instantly with Your Phone이 논문은 로봇 모방 학습의 핵심 제약인 비효율적인 데이터 수집과 느린 정책 반복 과정을 해결하고자 합니다.#Review#Robot Learning#Imitation Learning#Policy Iteration#Augmented Reality#Visual Foresight#Data Collection#Human-in-the-Loop#Smartphone2026년 3월 5일댓글 수 로딩 중
[논문리뷰] RealWonder: Real-Time Physical Action-Conditioned Video Generation본 논문은 기존 비디오 생성 모델이 3D 물리적 액션(예: 힘, 로봇 조작)의 결과를 시뮬레이션하지 못하는 한계를 해결하고자 합니다. 단일 이미지에서 3D 물리적 액션에 조건화된 비디오를 실시간으로 생성 하여, 사용자가 물리적 상호작용의 결과를 즉시 확인할 수 있도록 하는 것을 목표로 합니다.#Review#Video Generation#Physics Simulation#Real-Time#Action-Conditioned#3D Scene Reconstruction#Diffusion Models#Optical Flow2026년 3월 5일댓글 수 로딩 중
[논문리뷰] On-Policy Self-Distillation for Reasoning Compression본 논문은 대규모 언어 모델(LLM)이 추론 과정에서 생성하는 불필요하고 과도한 토큰으로 인한 비효율성 및 오류 누적 문제 를 해결하고자 합니다. 정답 데이터나 토큰 예산 같은 외부 제약 없이 모델 스스로 간결하게 추론하도록 학습시켜, 추론 과정의 압축과 동시에 정확도를 향상시키는 방법론을 제안합니다.#Review#Reasoning Compression#Self-Distillation#On-Policy Learning#Large Language Models#Mathematical Reasoning#Knowledge Distillation#Efficient Inference2026년 3월 5일댓글 수 로딩 중
[논문리뷰] Mozi: Governed Autonomy for Drug Discovery LLM Agents약물 발견과 같은 고위험 과학 도메인에서 제한 없는 LLM 에이전트 가 겪는 도구 사용 환각, 재현 불가능성, 그리고 장기적 신뢰성 부족 문제를 해결하고자 합니다.#Review#LLM Agents#Drug Discovery#Governed Autonomy#Multi-Agent System#Workflow Orchestration#Human-in-the-Loop#Computational Biology#Reproducibility2026년 3월 5일댓글 수 로딩 중
[논문리뷰] MOOSE-Star: Unlocking Tractable Training for Scientific Discovery by Breaking the Complexity Barrier본 논문은 대규모 언어 모델(LLM)을 활용한 과학적 발견 과정, 특히 P(hypothesis|background)의 직접적인 모델링이 지닌 조합론적 복잡성(O(Nk)) 으로 인한 비실용성을 해결하는 것을 목표로 합니다.#Review#Scientific Discovery#LLM Training#Combinatorial Complexity#Hierarchical Search#Bounded Composition#Motivation Planning#Tractable Training#TOMATO-STAR Dataset2026년 3월 5일댓글 수 로딩 중
[논문리뷰] MASQuant: Modality-Aware Smoothing Quantization for Multimodal Large Language Models다중 모달리티 대규모 언어 모델(MLLMs)에서 채널별 스무딩 양자화(channel-wise smoothing quantization) 기법이 시각 및 텍스트 토큰 활성화의 큰 차이로 인해 실패하는 문제를 해결하는 것이 목표입니다.#Review#Multimodal LLMs#Post-Training Quantization#Modality-Aware Smoothing#Cross-Modal Compensation#Quantization#Model Compression#SVD-based Whitening2026년 3월 5일댓글 수 로딩 중
[논문리뷰] Locality-Attending Vision Transformer본 논문은 이미지 분류 훈련 후 Vision Transformer (ViT)의 dense prediction 성능, 특히 segmentation 성능을 향상 시키는 것을 목표로 합니다.#Review#Vision Transformer#Semantic Segmentation#Attention Mechanism#Locality Bias#Gaussian Kernel#Patch Representation#Foundation Models2026년 3월 5일댓글 수 로딩 중
[논문리뷰] Large Multimodal Models as General In-Context Classifiers본 논문은 대규모 멀티모달 모델(LMMs)이 이미지 분류 작업에서 대조 학습 기반 시각-언어 모델(VLMs)보다 성능이 떨어진다는 기존 인식을 재고하고, 인컨텍스트 학습(ICL)이 LMMs의 분류 능력을 얼마나 향상시킬 수 있는지 탐구합니다.#Review#Large Multimodal Models#In-Context Learning#Image Classification#Open-World Classification#Zero-Shot Learning#Vision-Language Models#CLIP2026년 3월 5일댓글 수 로딩 중
[논문리뷰] KARL: Knowledge Agents via Reinforcement Learning본 논문은 기업 검색 에이전트가 복잡하고 검증하기 어려운 에이전트성 검색 태스크에서 최첨단 성능 을 달성하도록 강화 학습 을 통해 훈련하는 시스템인 KARL 을 제안합니다.#Review#Reinforcement Learning#Knowledge Agents#Enterprise Search#Grounded Reasoning#Multi-task Learning#Off-policy RL#Test-time Compute#Agentic Synthesis2026년 3월 5일댓글 수 로딩 중
[논문리뷰] HiFi-Inpaint: Towards High-Fidelity Reference-Based Inpainting for Generating Detail-Preserving Human-Product Images본 논문은 인간-제품 이미지 생성 시 제품 디테일의 높은 충실도(high-fidelity) 보존 을 보장하는 문제를 해결하고자 합니다.#Review#Reference-Based Inpainting#High-Fidelity Image Generation#Human-Product Images#Diffusion Models#Detail Preservation#Attention Mechanisms#Loss Functions#Dataset Construction2026년 3월 5일댓글 수 로딩 중
[논문리뷰] DreamWorld: Unified World Modeling in Video Generation기존 비디오 생성 모델들이 시각적 사실성만을 추구하고 세계에 대한 일관된 이해가 부족한 한계를 해결하는 것이 목표입니다. 물리적 상식, 3D 및 시간적 일관성과 같은 이질적인 세계 지식 을 비디오 생성기에 통합하고, 이로 인해 발생하는 시각적 불안정성과 시간적 깜빡임 문제를 완화하고자 합니다.#Review#Video Generation#World Modeling#Diffusion Models#Multi-modal Integration#Temporal Consistency#Spatial Geometry#Semantic Consistency#Constraint Annealing2026년 3월 5일댓글 수 로딩 중