최신 포스트

[논문리뷰] Robot Learning from a Physical World Model

arXiv에 게시된 'Robot Learning from a Physical World Model' 논문에 대한 자세한 리뷰입니다.

2025년 11월 10일

[논문리뷰] Reinforcement Learning Improves Traversal of Hierarchical Knowledge in LLMs

arXiv에 게시된 'Reinforcement Learning Improves Traversal of Hierarchical Knowledge in LLMs' 논문에 대한 자세한 리뷰입니다.

2025년 11월 10일

[논문리뷰] RedOne 2.0: Rethinking Domain-specific LLM Post-Training in Social Networking Services

Zijie Meng이 arXiv에 게시한 'RedOne 2.0: Rethinking Domain-specific LLM Post-Training in Social Networking Services' 논문에 대한 자세한 리뷰입니다.

2025년 11월 10일

[논문리뷰] Reasoning with Confidence: Efficient Verification of LLM Reasoning Steps via Uncertainty Heads

Jiaheng Zhang이 arXiv에 게시한 'Reasoning with Confidence: Efficient Verification of LLM Reasoning Steps via Uncertainty Heads' 논문에 대한 자세한 리뷰입니다.

2025년 11월 10일

[논문리뷰] RLoop: An Self-Improving Framework for Reinforcement Learning with Iterative Policy Initialization

Wenhao Huang이 arXiv에 게시한 'RLoop: An Self-Improving Framework for Reinforcement Learning with Iterative Policy Initialization' 논문에 대한 자세한 리뷰입니다.

2025년 11월 10일

[논문리뷰] RLVE: Scaling Up Reinforcement Learning for Language Models with Adaptive Verifiable Environments

Shuyue Stella Li이 arXiv에 게시한 'RLVE: Scaling Up Reinforcement Learning for Language Models with Adaptive Verifiable Environments' 논문에 대한 자세한 리뷰입니다.

2025년 11월 10일

[논문리뷰] Omni-AVSR: Towards Unified Multimodal Speech Recognition with Large Language Models

arXiv에 게시된 'Omni-AVSR: Towards Unified Multimodal Speech Recognition with Large Language Models' 논문에 대한 자세한 리뷰입니다.

2025년 11월 10일

[논문리뷰] NURBGen: High-Fidelity Text-to-CAD Generation through LLM-Driven NURBS Modeling

arXiv에 게시된 'NURBGen: High-Fidelity Text-to-CAD Generation through LLM-Driven NURBS Modeling' 논문에 대한 자세한 리뷰입니다.

2025년 11월 10일

[논문리뷰] MVU-Eval: Towards Multi-Video Understanding Evaluation for Multimodal LLMs

arXiv에 게시된 'MVU-Eval: Towards Multi-Video Understanding Evaluation for Multimodal LLMs' 논문에 대한 자세한 리뷰입니다.

2025년 11월 10일

[논문리뷰] MPJudge: Towards Perceptual Assessment of Music-Induced Paintings

arXiv에 게시된 'MPJudge: Towards Perceptual Assessment of Music-Induced Paintings' 논문에 대한 자세한 리뷰입니다.

2025년 11월 10일

[논문리뷰] Long Grounded Thoughts: Distilling Compositional Visual Reasoning Chains at Scale

arXiv에 게시된 'Long Grounded Thoughts: Distilling Compositional Visual Reasoning Chains at Scale' 논문에 대한 자세한 리뷰입니다.

2025년 11월 10일

[논문리뷰] Llama-Embed-Nemotron-8B: A Universal Text Embedding Model for Multilingual and Cross-Lingual Tasks

arXiv에 게시된 'Llama-Embed-Nemotron-8B: A Universal Text Embedding Model for Multilingual and Cross-Lingual Tasks' 논문에 대한 자세한 리뷰입니다.

2025년 11월 10일

[논문리뷰] LUT-LLM: Efficient Large Language Model Inference with Memory-based Computations on FPGAs

Jason Cong이 arXiv에 게시한 'LUT-LLM: Efficient Large Language Model Inference with Memory-based Computations on FPGAs' 논문에 대한 자세한 리뷰입니다.

2025년 11월 10일

[논문리뷰] IterResearch: Rethinking Long-Horizon Agents via Markovian State Reconstruction

Haotian Xu이 arXiv에 게시한 'IterResearch: Rethinking Long-Horizon Agents via Markovian State Reconstruction' 논문에 대한 자세한 리뷰입니다.

2025년 11월 10일

[논문리뷰] HaluMem: Evaluating Hallucinations in Memory Systems of Agents

arXiv에 게시된 'HaluMem: Evaluating Hallucinations in Memory Systems of Agents' 논문에 대한 자세한 리뷰입니다.

2025년 11월 10일

[논문리뷰] Generating an Image From 1,000 Words: Enhancing Text-to-Image With Structured Captions

arXiv에 게시된 'Generating an Image From 1,000 Words: Enhancing Text-to-Image With Structured Captions' 논문에 대한 자세한 리뷰입니다.

2025년 11월 10일

[논문리뷰] FLEX: Continuous Agent Evolution via Forward Learning from Experience

Jiangjie Chen이 arXiv에 게시한 'FLEX: Continuous Agent Evolution via Forward Learning from Experience' 논문에 대한 자세한 리뷰입니다.

2025년 11월 10일

[논문리뷰] Do LLMs Feel? Teaching Emotion Recognition with Prompts, Retrieval, and Curriculum Learning

arXiv에 게시된 'Do LLMs Feel? Teaching Emotion Recognition with Prompts, Retrieval, and Curriculum Learning' 논문에 대한 자세한 리뷰입니다.

2025년 11월 10일

[논문리뷰] DigiData: Training and Evaluating General-Purpose Mobile Control Agents

arXiv에 게시된 'DigiData: Training and Evaluating General-Purpose Mobile Control Agents' 논문에 대한 자세한 리뷰입니다.

2025년 11월 10일

[논문리뷰] Diffusion-SDPO: Safeguarded Direct Preference Optimization for Diffusion Models

Zhao Xu이 arXiv에 게시한 'Diffusion-SDPO: Safeguarded Direct Preference Optimization for Diffusion Models' 논문에 대한 자세한 리뷰입니다.

2025년 11월 10일