[논문리뷰] Lance: Unified Multimodal Modeling by Multi-Task Synergy본 논문은 기존 멀티모달 모델들이 이해와 생성이라는 두 가지 이질적인 목적을 통합할 때 발생하는 성능 저하와 작업 범위의 한계를 해결하기 위해 제안되었습니다.#Review#Unified Multimodal Modeling#Multi-Task Synergy#Dual-Stream Architecture#Modality-Aware Rotary Positional Encoding#Autoregressive Modeling#Flow Matching2026년 5월 18일댓글 수 로딩 중
[논문리뷰] GaussianGPT: Towards Autoregressive 3D Gaussian Scene Generation본 논문은 기존 3D 생성 모델들이 주로 사용하는 전체적(holistic)인 Denoising이나 Diffusion 방식이 3D 환경의 점진적 구축과 편집에 부적합하다는 문제를 해결하고자 한다. 기존 방식은 고정된 장면을 한 번에 생성하는 경향이 있어, 실제 환경처럼 점진적으로 확장하거나 수정하는 유연성이 부족하다.#Review#3D Gaussian Splatting#Autoregressive Modeling#Scene Generation#Transformer#Vector Quantization#3D Scene Completion2026년 4월 1일댓글 수 로딩 중
[논문리뷰] LongCat-Next: Lexicalizing Modalities as Discrete Tokens기존의 멀티모달 시스템은 주로 언어 중심의 모델에 비언어적 모달리티를 외부 부착물(bolt-on) 형태로 결합하는 방식에 의존하여, 구조적 파편화와 최적화의 한계가 존재했습니다. 또한, 이산적 비전 모델링은 압축 과정에서의 정보 손실로 인해 성능의 상한선(ceiling)이 존재한다는 인식이 지배적이었습니다.#Review#Multimodality#Autoregressive Modeling#Discrete Tokenization#Vision Transformer#Audio Tokenization#Mixture-of-Experts#Next-Token Prediction2026년 3월 31일댓글 수 로딩 중
[논문리뷰] MOSS-TTS Technical ReportText-to-Speech (TTS)는 이제 Foundation Model처럼 동작하며, 다양한 화자, 언어, 스타일, 음향 조건에 걸쳐 Generalize하고, Controllable하며 Low-Latency Synthesis를 지원하며, Long-Form 콘텐츠에 대해 Stable해야 하는 Speech Generation의 광범위한 패러다임으로 진화하고 있습니다.#Review#Speech Generation#Foundation Model#Audio Tokenizer#Autoregressive Modeling#Voice Cloning#Duration Control#Multilingual TTS2026년 3월 19일댓글 수 로딩 중
[논문리뷰] tttLRM: Test-Time Training for Long Context and Autoregressive 3D Reconstruction본 논문은 기존 3D 재구성 모델들이 가지는 느린 최적화 , 제한적인 입력 뷰 확장성 , 그리고 긴 시퀀스 컨텍스트 처리 능력 의 한계를 극복하는 것을 목표로 합니다.#Review#3D Reconstruction#Test-Time Training (TTT)#Autoregressive Modeling#Long-Context#Gaussian Splatting#Neural Radiance Fields#Large Reconstruction Models2026년 2월 23일댓글 수 로딩 중
[논문리뷰] CHARM: Control-point-based 3D Anime Hairstyle Auto-Regressive Modeling본 연구는 기존 사실적인 헤어 모델링 기법으로는 다루기 어려운, 고도로 양식화된 3D 애니메이션 헤어스타일 의 효율적인 모델링 및 생성 문제를 해결하고자 합니다.#Review#3D Anime Hairstyle#Autoregressive Modeling#Control Points#Parametric Representation#Transformer#Generative AI#Dataset (AnimeHair)#Computer Graphics2025년 9월 26일댓글 수 로딩 중
[논문리뷰] Causal Attention with Lookahead Keys이 연구는 자기회귀(autoregressive) 언어 모델 의 핵심 구성 요소인 표준 인과적 어텐션(causal attention)이 이전 문맥에만 의존하여 전역적 문맥 파악과 자연어 이해 능력을 저해하는 문제를 해결하는 것을 목표로 합니다.#Review#Causal Attention#Lookahead Keys#Autoregressive Modeling#Language Models#Transformer#Perplexity Reduction#Parallel Training#Efficient Inference2025년 9월 10일댓글 수 로딩 중