[논문리뷰] LLaDA2.0-Uni: Unifying Multimodal Understanding and Generation with Diffusion Large Language Model본 연구는 통합된 multimodal 이해와 생성을 위해 독립적인 아키텍처 대신 dLLM 기반의 단일 프레임워크를 구축하는 것을 목표로 합니다.#Review#Multimodal Foundation Model#Diffusion Large Language Model#SigLIP-VQ#Unified Architecture#Block-wise Masked Diffusion2026년 4월 22일댓글 수 로딩 중