본문으로 건너뛰기

#Multimodal Large Language Model (MLLM)

5개의 포스트

[논문리뷰] LoomVideo: Unifying Multimodal Inputs into Video Generation and Editing

댓글 수 로딩 중

[논문리뷰] SIMART: Decomposing Monolithic Meshes into Sim-ready Articulated Assets via MLLM

댓글 수 로딩 중

[논문리뷰] EditThinker: Unlocking Iterative Reasoning for Any Image Editor

댓글 수 로딩 중

[논문리뷰] OralGPT-Omni: A Versatile Dental Multimodal Large Language Model

댓글 수 로딩 중