[논문리뷰] Medical SAM3: A Foundation Model for Universal Prompt-Driven Medical Image Segmentation

수정: 2026년 1월 20일

링크: 논문 PDF로 바로 열기

저자: Chongcong Jiang, Tianxingjian Ding, Chuhan Song, Jiachen Tu, Ziyang Yan, Yihua Shao, Zhenyi Wang, Yuzhang Shang, Tianyu Han, Yu Tian

핵심 연구 목표

본 논문은 일반 자연 이미지에 대해 강력한 성능을 보인 SAM3 와 같은 프롬프트 기반 분할 파운데이션 모델이 심각한 도메인 시프트, 특권적인 공간 프롬프트의 부재, 복잡한 해부학적 및 체적 구조 추론의 필요성으로 인해 의료 영상 분할에 직접 적용하기 어려운 문제를 해결하는 것을 목표로 합니다. 의료 영상에 특화된 범용 프롬프트 기반 분할 파운데이션 모델 을 개발하여 이러한 한계를 극복하고자 합니다.

핵심 방법론

이 연구는 SAM3 모델을 33개 대규모, 이질적인 2D 및 3D 의료 영상 데이터셋 에 대해 완전한 매개변수 미세 조정(full fine-tuning) 하는 방식을 제안합니다. 특히, 텍스트 프롬프트 만으로 세분화를 유도하며, 원본 SAM3 아키텍처는 변경하지 않고 Layer-wise Learning Rate Decay (LLRD) 를 적용하여 일반적인 시각적 특징을 유지하면서 깊은 계층이 의료 세부 사항에 전문화되도록 유도합니다. 세트 예측 목표(Set-Prediction Objective) 를 통해 인스턴스 발견 및 의미론적 분할을 공동으로 감독합니다.

주요 결과

Medical SAM3 는 내부 검증 10개 태스크에서 원본 SAM3 대비 평균 Dice 점수를 54.0%에서 77.0%23.0%p 향상시켰으며, IoU는 43.3%에서 67.3%24.0%p 향상시켰습니다. 외부 검증 7개 데이터셋에서는 평균 Dice 점수를 11.9%에서 73.9%62.0%p 라는 압도적인 성능 향상을 보였으며, 특히 CVC 및 ETIS 데이터셋의 내시경 용종 분할에서 기준 모델의 0.0% Dice 에서 각각 87.9%86.1% Dice 로 성능이 극적으로 개선되었습니다.

AI 실무자를 위한 시사점

이 연구는 의료 영상 분야에서 텍스트 기반 프롬프트 를 통해 공간 프롬프트 없이도 강력한 세분화 성능을 달성할 수 있음을 입증했습니다. 이는 실제 임상 환경에서 의사가 특정 ROI를 수동으로 지정할 필요 없이 자연어 쿼리만으로 세분화를 수행할 수 있는 잠재력을 제공합니다. 또한, 심각한 도메인 시프트 환경에서는 경량 어댑터 대신 홀리스틱 모델 적응(holistic model adaptation) 의 중요성을 강조하여, 파운데이션 모델의 잠재력을 최대한 활용하기 위한 효과적인 전략을 제시합니다.

⚠️ 알림: 이 리뷰는 AI로 작성되었습니다.

태그

#Review#Medical Image Segmentation#Foundation Models#SAM3#Fine-tuning#Prompt-driven#Domain Adaptation#Text-guided Segmentation

Review 의 다른글