[논문리뷰] Optimizing Diversity and Quality through Base-Aligned Model CollaborationJonathan May이 [arXiv]에 게시한 'Optimizing Diversity and Quality through Base-Aligned Model Collaboration' 논문에 대한 자세한 리뷰입니다.2025년 11월 12일
[논문리뷰] KLASS: KL-Guided Fast Inference in Masked Diffusion Models이 [arXiv]에 게시한 'KLASS: KL-Guided Fast Inference in Masked Diffusion Models' 논문에 대한 자세한 리뷰입니다.2025년 11월 12일
[논문리뷰] Intelligence per Watt: Measuring Intelligence Efficiency of Local AI이 [arXiv]에 게시한 'Intelligence per Watt: Measuring Intelligence Efficiency of Local AI' 논문에 대한 자세한 리뷰입니다.2025년 11월 12일
[논문리뷰] Grounding Computer Use Agents on Human Demonstrations이 [arXiv]에 게시한 'Grounding Computer Use Agents on Human Demonstrations' 논문에 대한 자세한 리뷰입니다.2025년 11월 12일
[논문리뷰] DynaAct: Large Language Model Reasoning with Dynamic Action SpacesLingpeng Kong이 [arXiv]에 게시한 'DynaAct: Large Language Model Reasoning with Dynamic Action Spaces' 논문에 대한 자세한 리뷰입니다.2025년 11월 12일
[논문리뷰] BiCA: Effective Biomedical Dense Retrieval with Citation-Aware Hard Negatives이 [arXiv]에 게시한 'BiCA: Effective Biomedical Dense Retrieval with Citation-Aware Hard Negatives' 논문에 대한 자세한 리뷰입니다.2025년 11월 12일
[논문리뷰] Beyond Fact Retrieval: Episodic Memory for RAG with Generative Semantic WorkspacesVwani Roychowdhury이 [arXiv]에 게시한 'Beyond Fact Retrieval: Episodic Memory for RAG with Generative Semantic Workspaces' 논문에 대한 자세한 리뷰입니다.2025년 11월 12일
[논문리뷰] Beyond English: Toward Inclusive and Scalable Multilingual Machine Translation with LLMs이 [arXiv]에 게시한 'Beyond English: Toward Inclusive and Scalable Multilingual Machine Translation with LLMs' 논문에 대한 자세한 리뷰입니다.2025년 11월 12일
[논문리뷰] Adaptive Multi-Agent Response Refinement in Conversational Systems이 [arXiv]에 게시한 'Adaptive Multi-Agent Response Refinement in Conversational Systems' 논문에 대한 자세한 리뷰입니다.2025년 11월 12일
[논문리뷰] VADER: Towards Causal Video Anomaly Understanding with Relation-Aware Large Language Models이 [arXiv]에 게시한 'VADER: Towards Causal Video Anomaly Understanding with Relation-Aware Large Language Models' 논문에 대한 자세한 리뷰입니다.2025년 11월 11일
[논문리뷰] The Station: An Open-World Environment for AI-Driven Discoverywydu이 [arXiv]에 게시한 'The Station: An Open-World Environment for AI-Driven Discovery' 논문에 대한 자세한 리뷰입니다.2025년 11월 11일
[논문리뷰] Teaching Pretrained Language Models to Think Deeper with Retrofitted Recurrence이 [arXiv]에 게시한 'Teaching Pretrained Language Models to Think Deeper with Retrofitted Recurrence' 논문에 대한 자세한 리뷰입니다.2025년 11월 11일
[논문리뷰] SofT-GRPO: Surpassing Discrete-Token LLM Reinforcement Learning via Gumbel-Reparameterized Soft-Thinking Policy Optimization이 [arXiv]에 게시한 'SofT-GRPO: Surpassing Discrete-Token LLM Reinforcement Learning via Gumbel-Reparameterized Soft-Thinking Policy Optimization' 논문에 대한 자세한 리뷰입니다.2025년 11월 11일
[논문리뷰] SWE-fficiency: Can Language Models Optimize Real-World Repositories on Real Workloads?Ofir Press이 [arXiv]에 게시한 'SWE-fficiency: Can Language Models Optimize Real-World Repositories on Real Workloads?' 논문에 대한 자세한 리뷰입니다.2025년 11월 11일
[논문리뷰] Routing Manifold Alignment Improves Generalization of Mixture-of-Experts LLMsZiyue Li이 [arXiv]에 게시한 'Routing Manifold Alignment Improves Generalization of Mixture-of-Experts LLMs' 논문에 대한 자세한 리뷰입니다.2025년 11월 11일
[논문리뷰] Robot Learning from a Physical World Model이 [arXiv]에 게시한 'Robot Learning from a Physical World Model' 논문에 대한 자세한 리뷰입니다.2025년 11월 11일
[논문리뷰] Reinforcement Learning Improves Traversal of Hierarchical Knowledge in LLMs이 [arXiv]에 게시한 'Reinforcement Learning Improves Traversal of Hierarchical Knowledge in LLMs' 논문에 대한 자세한 리뷰입니다.2025년 11월 11일
[논문리뷰] RedOne 2.0: Rethinking Domain-specific LLM Post-Training in Social Networking ServicesZijie Meng이 [arXiv]에 게시한 'RedOne 2.0: Rethinking Domain-specific LLM Post-Training in Social Networking Services' 논문에 대한 자세한 리뷰입니다.2025년 11월 11일
[논문리뷰] Reasoning with Confidence: Efficient Verification of LLM Reasoning Steps via Uncertainty HeadsJiaheng Zhang이 [arXiv]에 게시한 'Reasoning with Confidence: Efficient Verification of LLM Reasoning Steps via Uncertainty Heads' 논문에 대한 자세한 리뷰입니다.2025년 11월 11일
[논문리뷰] RLoop: An Self-Improving Framework for Reinforcement Learning with Iterative Policy InitializationWenhao Huang이 [arXiv]에 게시한 'RLoop: An Self-Improving Framework for Reinforcement Learning with Iterative Policy Initialization' 논문에 대한 자세한 리뷰입니다.2025년 11월 11일