[논문리뷰] GDCNet: Generative Discrepancy Comparison Network for Multimodal Sarcasm Detection본 논문은 이미지-텍스트 쌍에서 풍자(sarcasm)를 효과적으로 탐지하기 위해 기존 방법론의 한계를 극복하는 것을 목표로 합니다.#Review#Multimodal Sarcasm Detection#Large Language Models#Multimodal LLMs#Discrepancy Modeling#Image Captioning#Gated Fusion#Semantic Incongruity2026년 1월 28일댓글 수 로딩 중
[논문리뷰] Mixture of Horizons in Action Chunking본 논문은 Vision-Language-Action (VLA) 모델 에서 고정된 액션 청크 길이(horizon) 가 유발하는 근본적인 한계점을 해결하고자 합니다.#Review#Vision-Language-Action Models#Action Chunking#Robotic Manipulation#Multi-horizon Planning#Transformer Architecture#Gated Fusion#Dynamic Inference2025년 12월 2일댓글 수 로딩 중
[논문리뷰] OmniFusion: Simultaneous Multilingual Multimodal Translations via Modular Fusion본 논문은 텍스트 전용 번역 LLM이 겪는 지연 시간과 멀티모달 컨텍스트 활용 불가능성, 그리고 MMFM이 가진 다국어 번역 성능 및 커버리지의 한계를 해결하고자 합니다.#Review#Multimodal Translation#Speech Translation#Simultaneous Translation#Large Language Models#Multimodal Foundation Models#Modular Fusion#End-to-End#Gated Fusion#OCR2025년 12월 1일댓글 수 로딩 중
[논문리뷰] FSG-Net: Frequency-Spatial Synergistic Gated Network for High-Resolution Remote Sensing Change Detection고해상도 원격 감지 변화 탐지에서 발생하는 두 가지 주요 문제, 즉 복사량 변화로 인한 가짜 변화(pseudo-changes)의 만연 과 깊은 추상적 특징과 얕은 세부 특징 간의 의미론적 간극 으로 인한 불분명한 경계 문제를 해결하는 것을 목표로 합니다.#Review#Change Detection#Remote Sensing#Frequency-Spatial Analysis#Wavelet Transform#Attention Mechanism#Gated Fusion#Deep Learning2025년 9월 19일댓글 수 로딩 중