#Task Arithmetic

4개의 포스트

[논문리뷰] Understanding and Enforcing Weight Disentanglement in Task Arithmetic

본 논문은 Task Arithmetic의 성공 뒤에 숨겨진 근본적인 이론적 원리를 규명하고, 이를 기반으로 성능을 개선하는 것을 목표로 한다.

#Review #Task Arithmetic #Weight Disentanglement #Model Merging #Orthogonal Regularization #Task-Feature Specialization

2026년 4월 21일

[논문리뷰] Knowledge is Not Enough: Injecting RL Skills for Continual Adaptation

대규모 언어 모델(LLMs)이 겪는 '지식 단절(knowledge cutoff)' 문제와, 지도 미세 조정(SFT)이 새로운 지식 통합 시 추론 능력 향상에 한계가 있으며, 강화 학습(RL)은 온라인 적응에 비실용적으로 비싼 비용 문제를 해결하는 것이 목표입니다.

#Review #LLMs #Continual Adaptation #Reinforcement Learning #Supervised Fine-Tuning #Skill Transfer #Task Arithmetic #Tool Use

2026년 1월 25일

[논문리뷰] Reasoning Vectors: Transferring Chain-of-Thought Capabilities via Task Arithmetic

본 논문은 대규모 언어 모델(LLM)이 복잡한 추론 능력을 습득하기 위해 필요한 값비싼 강화 학습(RL) 기반 최적화 과정을 대체하는 방법을 모색합니다.

#Review #Reasoning Vectors #Task Arithmetic #Chain-of-Thought #LLMs #Reinforcement Learning #Model Merging #Parameter Transfer

2025년 9월 3일

[논문리뷰] Pseudo2Real: Task Arithmetic for Pseudo-Label Correction in Automatic Speech Recognition

본 논문은 ASR 도메인 적응 시 타겟 도메인의 실제 레이블(ground truth)이 없는 상황에서 pseudo-labeling 으로 인해 발생하는 체계적인 오류 패턴을 완화하는 것을 목표로 합니다.

#Review #ASR #Pseudo-labeling #Domain Adaptation #Task Arithmetic #Correction Vector #Accent Adaptation #Speaker Clustering #Model Editing

2025년 10월 13일