[논문리뷰] AutoResearchClaw: Self-Reinforcing Autonomous Research with Human-AI Collaboration본 논문은 기존의 자동화된 과학 연구 시스템들이 연구의 반복적이고 비선형적인 특성을 제대로 모델링하지 못하는 한계를 해결하기 위해 제안되었습니다. 현재의 시스템들은 주로 단일 에이전트의 선형 파이프라인에 의존하며, 실험 실패 시 모든 진행 상황을 포기하고, 이전 실행으로부터 학습하지 못하는 치명적인 단점이 있습니다 .#Review#Autonomous Research#Multi-Agent Debate#Self-Healing Execution#Human-in-the-Loop#Scientific Integrity#Cross-Run Evolution#ARC-Bench2026년 5월 19일댓글 수 로딩 중
[논문리뷰] Aurora: Unified Video Editing with a Tool-Using Agent본 논문은 현대의 통합형 비디오 편집 모델들이 모델이 처리할 수 있는 형식의 입력(model-ready input)을 전제로 설계되어 있어, 실제 사용자의 불완전한 자연어 요청을 처리하는 데 한계가 있다는 문제에서 출발합니다.#Review#Video Editing#Tool-Using Agent#Unified Diffusion Transformer#Visual Underspecification#Instruction Following2026년 5월 19일댓글 수 로딩 중
[논문리뷰] Artifact-Bench: Evaluating MLLMs on Detecting and Assessing the Artifacts of AI-Generated Videos본 연구는 빠르게 발전하는 Video Generation 모델들의 품질을 정밀하게 평가하기 위한 표준화된 도구가 부족하다는 점을 해결하고자 한다. 현재의 Video Generation 모델들은 뛰어난 시각적 결과물을 제공하지만, 여전히 고유한 형태의 시각적 오류인 아티팩트를 빈번하게 발생시킨다.#Review#Multimodal Large Language Models#AI-Generated Videos#Artifact Detection#Video Quality Assessment#Benchmarking2026년 5월 19일댓글 수 로딩 중
[논문리뷰] Anti-Self-Distillation for Reasoning RL via Pointwise Mutual Information본 논문은 LLM의 추론 능력을 강화하기 위한 on-policy self-distillation 기법이 수학적 추론 과제에서 일관된 성능 향상을 보이지 못하는 문제를 해결합니다.#Review#Reinforcement Learning#Self-Distillation#Reasoning#Pointwise Mutual Information#LLM#GRPO#Jensen-Shannon Divergence2026년 5월 19일댓글 수 로딩 중
[논문리뷰] Active Learners as Efficient PRP Rerankers본 요청은 논문 분석을 위해 제공해주신 URL(https://arxiv.org/html/2605.14236)에 접근을 시도하였으나, 네트워크 오류로 인해 논문 본문 내용을 직접 추출할 수 없었습니다.#Review2026년 5월 19일댓글 수 로딩 중
[cpython] CPython 성능 최적화: 임시 리스트를 튜플로 변환할 때의 '아이템 스틸' 기법CPython 3.14에서 도입된 INTRINSIC_LIST_TO_TUPLE 최적화를 통해 불필요한 메모리 복사를 제거하고 성능을 8%까지 끌어올린 과정을 살펴봅니다.#CPython#Python Internals#Optimization#Performance#C-API2026년 5월 18일댓글 수 로딩 중
[loki] Grafana Loki: Range Aggregation 성능 최적화와 메모리 할당 감소overlapping window 시나리오에서 불필요한 메모리 할당을 제거하여 성능을 39% 향상시킨 사례 분석#Golang#Grafana Loki#Performance#Optimization#Memory Management2026년 5월 18일댓글 수 로딩 중
[vllm] vLLM Qwen3.5 GDN 최적화: `einops.rearrange`를 `torch.flatten`으로 교체하여 20배 성능 향상!vLLM에서 Qwen3.5 GDN 레이어의 `einops.rearrange`를 `torch.flatten`으로 교체하여 Python 오버헤드를 줄이고 최대 21배의 속도 향상을 달성한 최적화 사례.#vLLM#PyTorch#Optimization#Performance#DeepLearning#Qwen3.5#einops#flatten2026년 5월 18일댓글 수 로딩 중
[transformers] Hugging Face Transformers: Continuous Batching에 Tensor Parallelism 도입하기Continuous Batching 환경에서 Tensor Parallelism을 지원하여 대규모 언어 모델의 추론 성능을 극대화하는 최적화 기법 분석.#HuggingFace#Transformers#TensorParallelism#ContinuousBatching#LLM2026년 5월 18일댓글 수 로딩 중
[sglang] DeepSeekV4 Fused MoE Triton 커널 지원 추가: 성능 최적화 분석DeepSeekV4 모델의 Fused MoE Triton 커널 지원을 추가하여 추론 성능을 향상시킨 PR 분석#AI#LLM#Optimization#Triton#DeepSeekV4#MoE2026년 5월 18일댓글 수 로딩 중
[논문리뷰] Where Should Diffusion Enter a Language Model? Geometry-Guided Hidden-State Replacement본 논문은 기존의 연속적 diffusion 언어 모델이 오토레그레시브 Transformer보다 성능이 뒤처지는 문제를 해결하고자 한다. 기존 연구들은 주로 토큰 수준의 확산이나 복잡한 continuous-to-discrete recovery 과정에서 발생하는 오차를 한계로 지적한다.#Review#Diffusion-Transformer Hybrid#Hidden-State Reconstruction#Geometry-Guided#Diffusion-Friendly#Representation Geometry#Locate-and-Replace2026년 5월 18일댓글 수 로딩 중
[논문리뷰] VideoSeeker: Incentivizing Instance-level Video Understanding via Native Agentic Tool Invocation본 논문은 기존의 LLM 기반 비디오 이해 모델들이 겪는 공간적·시간적 참조의 모호성 문제를 해결하기 위해 VideoSeeker를 제안한다.#Review#Large Vision-Language Models#Instance-level Video Understanding#Visual Prompts#Agentic Tool Invocation#Reinforcement Learning#Data Synthesis Pipeline2026년 5월 18일댓글 수 로딩 중
[논문리뷰] Targeted Neuron Modulation via Contrastive Pair SearchLLM이 유해한 요청을 거부하도록 Instruction-tuning되지만, 이러한 Safety behavior의 Mechanistic basis는 여전히 불분명하다.#Review#Neuron Modulation#Contrastive Neuron Attribution#Refusal Mechanisms#Alignment Fine-tuning#Mechanistic Interpretability#Behavioral Steering#MLP Neurons2026년 5월 18일댓글 수 로딩 중
[논문리뷰] TOBench: A Task-Oriented Omni-Modal Benchmark for Real-World Tool-Using Agents본 논문은 실세계의 복잡한 전문 워크플로우를 수행하는 Agent의 능력과 이를 평가하는 기존 벤치마크 사이의 격차를 해소하고자 합니다.#Review#Agentic AI#Omni-modal#Tool-using Agents#Model Context Protocol#Closed-loop Verification#Benchmark2026년 5월 18일댓글 수 로딩 중
[논문리뷰] Stop When Reasoning Converges: Semantic-Preserving Early Exit for Reasoning Models본 논문은 LRM이 복잡한 문제 해결 과정에서 정답을 찾은 후에도 반복적인 검증이나 재구성을 수행하며 자원을 낭비하는 Overthinking 문제를 해결하고자 합니다 .#Review#Large Reasoning Models#Early Exit#Chain of Thought#Semantic Redundancy#Inference Efficiency#Answer Verification2026년 5월 18일댓글 수 로딩 중
[논문리뷰] StableVLA: Towards Robust Vision-Language-Action Models without Extra Data본 논문은 기존 VLA 모델들이 훈련 데이터에 포함되지 않은 실세계의 다양한 시각적 노이즈(센서 노이즈, 모션 블러 등)에 매우 취약하다는 점을 지적합니다. 현재의 VLA 모델은 주로 깨끗한 환경에서만 평가되며, 실제 배포 시 시각적 왜곡이 발생하면 성능이 급격히 저하되는 'robustness gap'을 보입니다.#Review#Vision-Language-Action Models#Information Bottleneck#Robustness#Modality Alignment#Embodied AI#Adapter Design2026년 5월 18일댓글 수 로딩 중
[논문리뷰] SkillsVote: Lifecycle Governance of Agent Skills from Collection, Recommendation to Evolution본 연구는 대규모 오픈소스 Skill 생태계의 비정형성, 중복성, 품질 불균형 문제를 해결하고 에이전트의 효율적인 경험 재사용을 가능하게 하는 체계적인 거버넌스 프레임워크를 제안합니다.#Review#LLM Agents#Agent Skills#Lifecycle Governance#Skill Recommendation#Attribution#Skill Evolution2026년 5월 18일댓글 수 로딩 중
[논문리뷰] SafeDiffusion-R1: Online Reward Steering for Safe Diffusion Post-Training본 논문은 기존의 T2I 모델 안전성 확보 방식들이 가진 데이터 의존성과 모델 성능 저하 문제를 해결하고자 합니다.#Review#Diffusion Models#Safety Alignment#Online Reinforcement Learning#GRPO#CLIP#Concept Erasure2026년 5월 18일댓글 수 로딩 중
[논문리뷰] SNLP: Layer-Parallel Inference via Structured Newton Corrections본 논문은 Transformer 모델의 고질적인 문제인 Layer-wise Dependency로 인한 추론 지연(Latency) 문제를 해결하고자 합니다.#Review#Layer-Parallel Inference#Structured Newton Corrections#Transformer#Autoregressive#Solver-induced Inference Bias#Identity Newton#HC Newton2026년 5월 18일댓글 수 로딩 중
[논문리뷰] Post-Trained MoE Can Skip Half Experts via Self-Distillation기존의 Dynamic MoE 연구들은 주로 모델을 밑바닥부터 재학습(from scratch)하거나 특정 작업에만 국한된 적응 방식을 취해왔습니다. 그러나 실제 현업에서는 이미 사전 학습 및 후속 학습(SFT, RL 등)이 완료된 Post-Trained MoE 모델을 활용하는 경우가 대부분입니다.#Review#Mixture-of-Experts#Dynamic Inference#Self-Distillation#Zero-Expert Injection#Large Language Models#Model Adaptation2026년 5월 18일댓글 수 로딩 중