[논문리뷰] Semi-Supervised Noise Adaptation: Transferring Knowledge from Noise Domain본 연구는 레이블이 거의 없는 target domain에서 의미 있는 소스 데이터를 구하기 어려운 문제를 해결하기 위해, 무작위 생성된 노이즈 분포를 소스 도메인으로 활용하는 SSNA 문제를 정의한다.#Review#Semi-Supervised Learning#Transfer Learning#Noise Adaptation#Generalization Bound#Distribution Alignment#Representation Learning2026년 6월 3일댓글 수 로딩 중
[논문리뷰] MixSD: Mixed Contextual Self-Distillation for Knowledge Injection본 논문은 LLM에 새로운 지식을 주입할 때 발생하는 Catastrophic Forgetting 문제를 해결하고자 한다.#Review#Knowledge Injection#Self-Distillation#Catastrophic Forgetting#Language Models#Distribution Alignment#Fine-tuning2026년 5월 18일댓글 수 로딩 중
[논문리뷰] UDM-GRPO: Stable and Efficient Group Relative Policy Optimization for Uniform Discrete Diffusion Models본 논문은 `UDM`과 `GRPO`를 안정적으로 통합하기 위해 UDM-GRPO 프레임워크를 제안합니다. 첫째, 모든 타임스텝에서 액션을 중간 예측치가 아닌 최종 정제 샘플 `x_hat_1`으로 재정의하여 보상 일관성과 최적화 정밀도를 높였습니다 .#Review#Uniform Discrete Diffusion Model#Reinforcement Learning#GRPO#Text-to-Image Generation#Policy Optimization#Distribution Alignment2026년 4월 21일댓글 수 로딩 중