[sglang] AMD에서 MoE Gate router gemm을 tgemm.mm으로 교체DeepSeek-V2의 MoE gate router에서 수동 GEMM 분기를 aiter의 tgemm.mm 자동 디스패처로 교체하여 성능 회귀 해결#SGLang#AMD#ROCm#MoE#GEMM2026년 3월 31일댓글 수 로딩 중
[llm-compressor] GPTQ Block Quantization 지원GPTQ 양자화에 block quantization을 추가하여 더 세밀한 양자화 그룹 분할과 품질 향상#llm-compressor#Performance2026년 3월 31일댓글 수 로딩 중
[sglang] 멀티프로세스 JIT 컴파일로 Custom All Reduce 테스트 속도 향상SGLang의 custom all reduce 테스트에서 JIT 커널 컴파일을 멀티프로세스로 병렬화하여 테스트 시간을 500초에서 300초로 단축한 최적화 분석.#SGLang#Testing#JIT Compilation#Multiprocessing#All Reduce#CUDA2026년 3월 31일댓글 수 로딩 중
[Ultralytics] v8.4.28 — autobatch를 데이터셋 크기로 제한하여 소규모 데이터셋 학습 안정화데이터셋보다 큰 배치 크기가 산출되는 문제를 해결하고, 캘리브레이션 배치 크기 로직을 개선합니다.#Ultralytics#YOLO#Auto-batch#Training#INT82026년 3월 30일댓글 수 로딩 중
[Open WebUI] PanZoom 인스턴스 메모리 누수를 PanzoomContainer 컴포넌트로 통합 해결여러 컴포넌트에 분산된 panzoom 생성/해제 로직을 단일 PanzoomContainer로 통합하여 dispose 누락으로 인한 메모리 누수를 근본적으로 해결한 분석.#Open WebUI#Svelte#Performance#Memory Leak#Frontend2026년 3월 31일댓글 수 로딩 중
[논문리뷰] Unified Number-Free Text-to-Motion Generation Via Flow Matching기존의 Text-to-motion 모델들은 주로 단일 에이전트 생성에 국한되어 있으며, 다중 에이전트 생성의 경우 고정된 수의 에이전트만 처리할 수 있다는 한계가 있습니다.#Review#Text-to-Motion#Flow Matching#Number-Free Synthesis#Hierarchical Modeling#Multi-Person Interaction2026년 3월 30일댓글 수 로딩 중
[논문리뷰] Towards a Medical AI Scientist기존의 AI Scientist 프레임워크들은 수학이나 화학 등 일반적인 데이터와 프로토콜이 표준화된 영역에서 성과를 보였으나, 임상 의학 분야에 적용하는 데에는 한계가 있었습니다.#Review#Medical AI Scientist#Autonomous Scientific Discovery#Agentic Framework#Clinician-Engineer Co-reasoning#Med-AI Bench#Clinical Evidence Grounding2026년 3월 30일댓글 수 로딩 중
[논문리뷰] Think over Trajectories: Leveraging Video Generation to Reconstruct GPS Trajectories from Cellular Signaling통신 기지국 기반의 시그널링 기록은 광범위한 모빌리티 데이터를 제공하지만, 기지국 수준의 거친 공간 해상도로 인해 정밀한 위치 기반 분석에는 한계가 존재합니다. 기존의 산업적 솔루션들은 핑퐁 효과 제거, 지도 매칭, 경로 추론 등 복잡한 다단계 엔지니어링 파이프라인에 의존하여 Latency 가 높고 자동화가 어렵습니다 .#Review#Cellular Signaling#Video Generation#GPS Trajectory Reconstruction#Reinforcement Learning#Mobility Analytics#Sig2GPS2026년 3월 30일댓글 수 로딩 중
[논문리뷰] Superintelligence and Law본 논문은 Superintelligence 의 등장이 기존 법적 질서에 미칠 파괴적인 변화를 분석합니다. 인간의 감독 없이 자율적으로 작동하는 AI 에이전트가 현실 세계에서 법적 권리와 의무를 갖는 주체로 부상함에 따라, 기존의 법 이론과 도구만으로는 이를 통제하기 어렵다는 점이 핵심 문제로 지적됩니다.#Review#Superintelligence#AI Agents#Legal Alignment#Rule of Law#Legal Order#Legal Personhood#Coevolution2026년 3월 30일댓글 수 로딩 중
[논문리뷰] Story2Proposal: A Scaffold for Structured Scientific Paper Writing현재의 대규모 언어 모델 기반 논문 생성 파이프라인은 주로 Unconstrained text synthesis 방식에 의존하고 있어, 생성 과정에서 구조적 표류(Structural drift)나 시각적 요소의 누락, 섹션 간 불일치와 같은 심각한 문제가 발생합니다.#Review#Scientific Writing#Multi-Agent Systems#Contract-Governed Generation#Structural Integrity#Visual Alignment#Provenance Tracking2026년 3월 30일댓글 수 로딩 중
[논문리뷰] SEAR: Schema-Based Evaluation and Routing for LLM Gateways생성형 AI의 생산 환경 도입이 확산됨에 따라 다양한 모델과 제공자를 효율적으로 관리하고 라우팅하는 LLM gateway의 중요성이 커지고 있습니다. 그러나 기존의 평가 방식은 비정형 텍스트 기반이거나 단순한 점수 매기기에 그쳐, 복잡한 요청 상황에 대한 상세한 진단이나 운영 지표와의 결합이 어렵다는 한계가 있습니다.#Review#LLM Gateways#LLM-as-judge#Structured LLM Outputs#Schema-conforming Generation#LLM Routing2026년 3월 30일댓글 수 로딩 중
[논문리뷰] ResAdapt: Adaptive Resolution for Efficient Multimodal Reasoning최근의 MLLMs 는 입력 정보의 정밀도(fidelity)를 높여 성능을 향상시키지만, 이는 과도한 visual token의 증가로 이어져 고해상도와 긴 시간적 맥락(long temporal context)을 동시에 유지하는 것을 불가능하게 만듭니다.#Review#Multimodal Large Language Models (MLLMs)#Input-side Adaptation#Contextual Bandit#Cost-Aware Policy Optimization (CAPO)#Visual Budgeting#Efficient Inference#Temporal Reasoning2026년 3월 30일댓글 수 로딩 중
[논문리뷰] PRBench: End-to-end Paper Reproduction in Physics Research최근 LLM 기반 에이전트가 과학적 추론 및 코드 생성 분야에서 발전하고 있으나, 실제 과학 논문의 복잡한 계산 과정을 처음부터 끝까지 신뢰성 있게 재현할 수 있는지에 대해서는 검증되지 않았습니다.#Review#Scientific Reproduction#Agentified Assessment#Physics Benchmark#LLM#Sandboxed Execution2026년 3월 30일댓글 수 로딩 중
[논문리뷰] On-the-fly Repulsion in the Contextual Space for Rich Diversity in Diffusion Transformers최신 Text-to-Image(T2I) 모델들은 정교한 문맥 정렬 성능을 보이지만, Typicality Bias 로 인해 생성 결과가 좁은 범위의 시각적 해법에 고착되는 문제가 있습니다.#Review#Diffusion Transformers#Generative Diversity#Contextual Space#Repulsion Mechanism#Multi-modal Attention#Typicality Bias#Token Intervention2026년 3월 30일댓글 수 로딩 중
[논문리뷰] On Token's Dilemma: Dynamic MoE with Drift-Aware Token Assignment for Continual Learning of Large Vision Language ModelsLVLM은 다양한 도메인에서 우수한 성능을 보이지만, 새로운 지식을 연속적으로 습득할 때 기존 지식을 잃어버리는 'Catastrophic Forgetting' 문제가 존재합니다.#Review#Multimodal Continual Learning#Large Vision Language Models#Mixture of Experts#Routing-drift#Catastrophic Forgetting2026년 3월 30일댓글 수 로딩 중
[논문리뷰] MuSEAgent: A Multimodal Reasoning Agent with Stateful Experiences기존의 multimodal agent는 전체 interaction history를 기억하거나 trajectory 단위로 과거 경험을 검색하는 방식을 주로 사용해왔습니다.#Review#Multimodal Agent#Stateful Experience#Hindsight Reasoning#Compositional State Representation#Deep-and-Wide Search#Visual Reasoning2026년 3월 30일댓글 수 로딩 중
[논문리뷰] MolmoPoint: Better Pointing for VLMs with Grounding Tokens기존의 VLM들은 포인팅을 위해 텍스트 기반의 좌표를 생성하는 방식을 주로 사용해 왔습니다. 그러나 이러한 방식은 복잡한 좌표 시스템을 학습해야 하며, 토큰 사용량이 많아 효율성이 떨어지는 한계가 있습니다 .#Review#Vision-Language Models#Grounding Tokens#Pointing#GUI Grounding#Video Grounding#Sample Efficiency2026년 3월 30일댓글 수 로딩 중
[논문리뷰] Marco DeepResearch: Unlocking Efficient Deep Research Agents via Verification-Centric Design최근 Deep Research 분야는 급격히 발전했으나, 기존 에이전트 시스템은 QA 데이터 합성, 궤적 생성, 추론 단계에서 명시적인 검증 기법이 부재하다는 치명적인 한계를 가진다. 이로 인해 초기 단계의 오류가 하위 단계로 전파되어 전체 성능을 크게 저하시키는 문제가 발생한다 .#Review#Deep Research#Agentic Search#Verification-Centric Design#Data Synthesis#Test-time Scaling#ReAct#Multi-agent Systems2026년 3월 30일댓글 수 로딩 중
[논문리뷰] Make Geometry Matter for Spatial Reasoning최근 VLMs는 광범위한 훈련을 통해 일반적인 영상 이해 능력은 향상되었으나, 3D 공간상의 물체 관계나 움직임을 파악하는 Spatial Reasoning 에는 여전히 한계를 보입니다.#Review#Vision-Language Models#Spatial Reasoning#Geometry Tokens#Token Masking#Gated Routing2026년 3월 30일댓글 수 로딩 중
[논문리뷰] MOOZY: A Patient-First Foundation Model for Computational Pathology현재 병리 인공지능 분야의 파운데이션 모델들은 주로 Slide-centric 구조에 머물러 있어, 한 환자의 여러 슬라이드 간의 임상적 연관성을 효과적으로 모델링하지 못한다는 한계가 있습니다.#Review#Computational Pathology#Foundation Model#Patient-First Representation#Multi-Instance Learning#Self-Supervised Learning#Case Transformer2026년 3월 30일댓글 수 로딩 중