#Distribution Alignment

3개의 포스트

[논문리뷰] Semi-Supervised Noise Adaptation: Transferring Knowledge from Noise Domain

본 연구는 레이블이 거의 없는 target domain에서 의미 있는 소스 데이터를 구하기 어려운 문제를 해결하기 위해, 무작위 생성된 노이즈 분포를 소스 도메인으로 활용하는 SSNA 문제를 정의한다.

#Review #Semi-Supervised Learning #Transfer Learning #Noise Adaptation #Generalization Bound #Distribution Alignment #Representation Learning

2026년 6월 3일

[논문리뷰] MixSD: Mixed Contextual Self-Distillation for Knowledge Injection

본 논문은 LLM에 새로운 지식을 주입할 때 발생하는 Catastrophic Forgetting 문제를 해결하고자 한다.

#Review #Knowledge Injection #Self-Distillation #Catastrophic Forgetting #Language Models #Distribution Alignment #Fine-tuning

2026년 5월 18일

[논문리뷰] UDM-GRPO: Stable and Efficient Group Relative Policy Optimization for Uniform Discrete Diffusion Models

본 논문은 `UDM`과 `GRPO`를 안정적으로 통합하기 위해 UDM-GRPO 프레임워크를 제안합니다. 첫째, 모든 타임스텝에서 액션을 중간 예측치가 아닌 최종 정제 샘플 `x_hat_1`으로 재정의하여 보상 일관성과 최적화 정밀도를 높였습니다 .

#Review #Uniform Discrete Diffusion Model #Reinforcement Learning #GRPO #Text-to-Image Generation #Policy Optimization #Distribution Alignment

2026년 4월 21일