[논문리뷰] LagerNVS: Latent Geometry for Fully Neural Real-time Novel View SynthesisarXiv에 게시된 'LagerNVS: Latent Geometry for Fully Neural Real-time Novel View Synthesis' 논문에 대한 자세한 리뷰입니다.#Review#Novel View Synthesis (NVS)#Latent Geometry#Real-time Rendering#3D Inductive Biases#Encoder-Decoder#VGGT#Generalization#Diffusion Models2026년 3월 25일댓글 수 로딩 중
[논문리뷰] Language on Demand, Knowledge at Core: Composing LLMs with Encoder-Decoder Translation Models for Extensible MultilingualityYang Feng이 arXiv에 게시한 'Language on Demand, Knowledge at Core: Composing LLMs with Encoder-Decoder Translation Models for Extensible Multilinguality' 논문에 대한 자세한 리뷰입니다.#Review#LLMs#Multilinguality#Encoder-Decoder#Optimal Transport#Cross-Model Mapping#Language-on-Demand#NMT2026년 3월 22일댓글 수 로딩 중
[논문리뷰] SAM 3D Body: Robust Full-Body Human Mesh RecoveryTaosha Fan이 arXiv에 게시한 'SAM 3D Body: Robust Full-Body Human Mesh Recovery' 논문에 대한 자세한 리뷰입니다.#Review#Human Mesh Recovery (HMR)#Full-Body Pose Estimation#Promptable Models#Momentum Human Rig (MHR)#Data Engine#Encoder-Decoder#Robustness#3D Vision2026년 2월 18일댓글 수 로딩 중
[논문리뷰] JavisGPT: A Unified Multi-modal LLM for Sounding-Video Comprehension and GenerationarXiv에 게시된 'JavisGPT: A Unified Multi-modal LLM for Sounding-Video Comprehension and Generation' 논문에 대한 자세한 리뷰입니다.#Review#Multimodal LLM#Sounding Video#Video Comprehension#Video Generation#Audio-Video Synchronization#Instruction Tuning#Diffusion Model#Encoder-Decoder2025년 12월 31일댓글 수 로딩 중
[논문리뷰] NVIDIA Nemotron Parse 1.1arXiv에 게시된 'NVIDIA Nemotron Parse 1.1' 논문에 대한 자세한 리뷰입니다.#Review#OCR#Document Parsing#Vision-Language Model#Encoder-Decoder#Transformer#Table Extraction#Multilingual OCR#Layout Analysis2025년 11월 26일댓글 수 로딩 중
[논문리뷰] POWSM: A Phonetic Open Whisper-Style Speech Foundation ModelarXiv에 게시된 'POWSM: A Phonetic Open Whisper-Style Speech Foundation Model' 논문에 대한 자세한 리뷰입니다.#Review#Phonetic Foundation Model#Multitask Learning#Speech Recognition#Phone Recognition#Grapheme-to-Phoneme#Encoder-Decoder#Low-Resource Speech2025년 10월 31일댓글 수 로딩 중
[논문리뷰] EmbeddingGemma: Powerful and Lightweight Text RepresentationsMarksherwood이 arXiv에 게시한 'EmbeddingGemma: Powerful and Lightweight Text Representations' 논문에 대한 자세한 리뷰입니다.#Review#Text Embeddings#Lightweight Models#Encoder-Decoder#Knowledge Distillation#Model Souping#Quantization#Multilingual#Gemma2025년 9월 25일댓글 수 로딩 중
[논문리뷰] Beyond Transcription: Mechanistic Interpretability in ASRAviv Shamsian이 arXiv에 게시한 'Beyond Transcription: Mechanistic Interpretability in ASR' 논문에 대한 자세한 리뷰입니다.#Review#ASR#Mechanistic Interpretability#Logit Lens#Linear Probing#Activation Patching#Hallucinations#Repetitions#Encoder-Decoder2025년 8월 28일댓글 수 로딩 중
[논문리뷰] DeCRED: Decoder-Centric Regularization for Encoder-Decoder Based Speech RecognitionLukáš Burget이 arXiv에 게시한 'DeCRED: Decoder-Centric Regularization for Encoder-Decoder Based Speech Recognition' 논문에 대한 자세한 리뷰입니다.#Review#Speech Recognition#Encoder-Decoder#Regularization#Decoder-Centric#Intermediate Supervision#Out-of-Domain Generalization#Internal Language Model2025년 8월 13일댓글 수 로딩 중