[논문리뷰] Images in Sentences: Scaling Interleaved Instructions for Unified Visual Generation본 논문은 기존 멀티모달 생성 모델들이 복잡한 다중 이미지 명령을 처리할 때 발생하는 성능 저하 문제를 해결하기 위해 제안되었습니다.#Review#Multimodal Generation#Interleaved Instructions#Object Binding#Transformer#Multimodal Image Editing#Scalable Data Engine2026년 5월 12일댓글 수 로딩 중