본문으로 건너뛰기

#Efficiency

39개의 포스트

[논문리뷰] Mix-Quant: Quantized Prefilling, Precise Decoding for Agentic LLMs

댓글 수 로딩 중

[논문리뷰] SANA-WM: Efficient Minute-Scale World Modeling with Hybrid Linear Diffusion Transformer

댓글 수 로딩 중

[논문리뷰] Act Wisely: Cultivating Meta-Cognitive Tool Use in Agentic Multimodal Models

댓글 수 로딩 중

[논문리뷰] FP4 Explore, BF16 Train: Diffusion Reinforcement Learning via Efficient Rollout Scaling

댓글 수 로딩 중

[논문리뷰] Look Where It Matters: High-Resolution Crops Retrieval for Efficient VLMs

댓글 수 로딩 중

[논문리뷰] Search More, Think Less: Rethinking Long-Horizon Agentic Search for Efficiency and Generalization

댓글 수 로딩 중

[논문리뷰] InftyThink+: Effective and Efficient Infinite-Horizon Reasoning via Reinforcement Learning

댓글 수 로딩 중

[논문리뷰] InfiniteVL: Synergizing Linear and Sparse Attention for Highly-Efficient, Unlimited-Input Vision-Language Models

댓글 수 로딩 중

[논문리뷰] LongCat-Image Technical Report

댓글 수 로딩 중

[논문리뷰] Focused Chain-of-Thought: Efficient LLM Reasoning via Structured Input Information

댓글 수 로딩 중

[논문리뷰] MetaEmbed: Scaling Multimodal Retrieval at Test-Time with Flexible Late Interaction

댓글 수 로딩 중

[논문리뷰] FastFit: Accelerating Multi-Reference Virtual Try-On via Cacheable Diffusion Models

댓글 수 로딩 중

[논문리뷰] R-4B: Incentivizing General-Purpose Auto-Thinking Capability in MLLMs via Bi-Mode Annealing and Reinforce Learning

댓글 수 로딩 중

[논문리뷰] Pruning the Unsurprising: Efficient Code Reasoning via First-Token Surprisal

댓글 수 로딩 중

[논문리뷰] PixelRefer: A Unified Framework for Spatio-Temporal Object Referring with Arbitrary Granularity

댓글 수 로딩 중

[논문리뷰] E^2Rank: Your Text Embedding can Also be an Effective and Efficient Listwise Reranker

댓글 수 로딩 중

[논문리뷰] Native Hybrid Attention for Efficient Sequence Modeling

댓글 수 로딩 중

[논문리뷰] Efficient Multi-modal Large Language Models via Progressive Consistency Distillation

댓글 수 로딩 중

[논문리뷰] Apriel-1.5-15b-Thinker

댓글 수 로딩 중

[논문리뷰] Flash-Searcher: Fast and Effective Web Agents via DAG-Based Parallel Execution

댓글 수 로딩 중

[논문리뷰] Efficient Audio-Visual Speech Separation with Discrete Lip Semantics and Multi-Scale Global-Local Attention

댓글 수 로딩 중