본문으로 건너뛰기

#Model Merging

21개의 포스트

[논문리뷰] Darwin Family: MRI-Trust-Weighted Evolutionary Merging for Training-Free Scaling of Language-Model Reasoning

댓글 수 로딩 중

[논문리뷰] OptiMer: Optimal Distribution Vector Merging Is Better than Data Mixing for Continual Pre-Training

댓글 수 로딩 중

[논문리뷰] MemSifter: Offloading LLM Memory Retrieval via Outcome-Driven Proxy Reasoning

댓글 수 로딩 중

[논문리뷰] GTR-Turbo: Merged Checkpoint is Secretly a Free Teacher for Agentic VLM Training

댓글 수 로딩 중

[논문리뷰] Llama-Embed-Nemotron-8B: A Universal Text Embedding Model for Multilingual and Cross-Lingual Tasks

댓글 수 로딩 중

[논문리뷰] Hala Technical Report: Building Arabic-Centric Instruction & Translation Models at Scale

댓글 수 로딩 중

[논문리뷰] Delta Activations: A Representation for Finetuned Large Language Models

댓글 수 로딩 중

[논문리뷰] VisCodex: Unified Multimodal Code Generation via Merging Vision and Coding Models

댓글 수 로딩 중

[논문리뷰] Aryabhata: An exam-focused language model for JEE Math

댓글 수 로딩 중

[논문리뷰] Model Merging with Functional Dual Anchors

댓글 수 로딩 중

[논문리뷰] Directional Reasoning Injection for Fine-Tuning MLLMs

댓글 수 로딩 중