[논문리뷰] SingGuard: A Policy-Adaptive Multimodal LLM Guardrail with Dynamic Reasoning기존의 다중 모달 가드레일 모델들은 대부분 고정된 분류 체계(Static Taxonomy)에 의존하며, 배포 환경이나 정책 변화에 따라 유연하게 대응하지 못하는 한계가 있습니다. 특히 고정된 레이블을 사용하는 기존 모델은 미학습된 규칙이나 새로운 정책 상황에서 성능이 급격히 저하되는 문제가 발생합니다.#Review#Multimodal LLM#Guardrail#Policy-Adaptive#Dynamic Reasoning#Fast-Slow Decoupled RL#Safety Benchmark2026년 6월 28일댓글 수 로딩 중