본문으로 건너뛰기

#End-to-End Learning

11개의 포스트

[논문리뷰] MetaphorStar: Image Metaphor Understanding and Reasoning with End-to-End Visual Reinforcement Learning

댓글 수 로딩 중

[논문리뷰] MOSS-Audio-Tokenizer: Scaling Audio Tokenizers for Future Audio Foundation Models

댓글 수 로딩 중

[논문리뷰] LightOnOCR: A 1B End-to-End Multilingual Vision-Language Model for State-of-the-Art OCR

댓글 수 로딩 중

[논문리뷰] HunyuanOCR Technical Report

댓글 수 로딩 중

[논문리뷰] EVTAR: End-to-End Try on with Additional Unpaired Visual Reference

댓글 수 로딩 중

[논문리뷰] Chain-of-Agents: End-to-End Agent Foundation Models via Multi-Agent Distillation and Agentic RL

댓글 수 로딩 중