#Dataset Construction

11개의 포스트

[논문리뷰] KletterMix: Climbing Toward High-Quality German Pretraining Data

본 논문은 독일어 프리트레이닝 데이터의 낮은 품질과 부족한 문서화 문제를 해결하기 위해 KletterMix를 제안합니다. 기존의 독일어 데이터는 노이즈가 많은 웹 크롤링 기반이거나, 데이터 구조와 문서화 수준이 영어권 데이터에 비해 현저히 낮아 모델 성능 개선에 한계가 있었습니다.

#Review #Pretraining Data #German Corpus #Machine Translation #Dataset Construction #Quality Estimation #COMETKiwi #Language Modeling

2026년 6월 3일

[논문리뷰] GGT-100K: Generative Ground Truth for Generalizable Real-World Image Restoration

실세계 이미지 복원(IR) 모델은 학습 데이터 부족으로 인해 실제 환경에서의 일반화 성능이 현저히 떨어지는 고질적인 병목 현상을 겪고 있습니다. 합성 데이터는 실세계의 복잡한 열화(degradation) 과정을 제대로 모델링하지 못하며, 실제 촬영된 데이터는 비용과 확장성 및 장면 다양성 확보에 한계가 있습니다.

#Review #Image Restoration #Generative Ground Truth #Multimodal Foundation Models #Generalization #Dataset Construction #Quality Control

2026년 5월 31일

[논문리뷰] ResearchMath-14K: Scaling Research-Level Mathematics via Agents

본 논문은 최신 LLM이 기초적인 수학 경시 수준을 넘어 연구 수준(research-level)의 수학 문제를 해결하도록 유도하는 데 필요한 대규모 학습 데이터가 부족하다는 점을 해결하고자 한다.

#Review #Research-level Mathematics #Dataset Construction #Agentic Pipeline #Factuality #Reasoning Trajectories #Fine-tuning #Language Models

2026년 5월 27일

[논문리뷰] Generative World Renderer

본 논문은 generative inverse 및 forward rendering 기술을 실제 환경(in-the-wild)으로 확장하는 데 발생하는 데이터 병목 문제를 해결하는 것을 목표로 합니다.

#Review #Generative World Renderer #Inverse Rendering #G-buffer #Dataset Construction #Video Diffusion Models #VLM-based Evaluation

2026년 4월 2일

[논문리뷰] WeEdit: A Dataset, Benchmark and Glyph-Guided Framework for Text-centric Image Editing

저자들은 instruction-based image editing 분야에서 text-centric image editing 이 중요한 응용 잠재력에도 불구하고 아직 충분히 탐구되지 않은 영역임을 지적합니다.

#Review #Text-centric Image Editing #Diffusion Models #Glyph-Guided Fine-tuning #Reinforcement Learning #Multilingual Benchmark #Dataset Construction

2026년 3월 12일

[논문리뷰] HiFi-Inpaint: Towards High-Fidelity Reference-Based Inpainting for Generating Detail-Preserving Human-Product Images

본 논문은 인간-제품 이미지 생성 시 제품 디테일의 높은 충실도(high-fidelity) 보존 을 보장하는 문제를 해결하고자 합니다.

#Review #Reference-Based Inpainting #High-Fidelity Image Generation #Human-Product Images #Diffusion Models #Detail Preservation #Attention Mechanisms #Loss Functions #Dataset Construction

2026년 3월 5일

[논문리뷰] LSRIF: Logic-Structured Reinforcement Learning for Instruction Following

본 논문은 대규모 언어 모델(LLMs)이 복잡한 실세계 명령, 특히 순차적 의존성이나 조건부 분기와 같은 논리적 구조 를 포함하는 명령을 따르는 데 어려움을 겪는 문제를 해결하고자 합니다.

#Review #Instruction Following #Reinforcement Learning #Logical Structures #LLMs #Reward Modeling #Dataset Construction #Attention Mechanism

2026년 1월 15일

[논문리뷰] Preserving Source Video Realism: High-Fidelity Face Swapping for Cinematic Quality

본 논문은 기존의 얼굴 교체(face swapping) 기술들이 장시간의 복잡한 비디오 시퀀스에서 높은 충실도(high fidelity)와 시간적 일관성(temporal consistency)을 유지하는 데 어려움을 겪는 문제를 해결하고자 합니다.

#Review #Face Swapping #Video Editing #Diffusion Models #Reference-guided Generation #Temporal Consistency #Keyframe Conditioning #Cinematic Quality #Dataset Construction

2025년 12월 9일

[논문리뷰] We-Math 2.0: A Versatile MathBook System for Incentivizing Visual Mathematical Reasoning

복잡한 시각 수학적 추론에서 Multimodal Large Language Models (MLLMs) 의 한계를 극복하는 것을 목표로 합니다.

#Review #Visual Mathematical Reasoning #MLLMs #Knowledge System #Reinforcement Learning #Curriculum Learning #Dataset Construction #Mathematical Benchmark

2025년 8월 15일

[논문리뷰] Conan: Progressive Learning to Reason Like a Detective over Multi-Scale Visual Evidence

본 논문은 멀티모달 대규모 언어 모델(MLLMs)이 순수 텍스트 추론이나 부정확한 증거 지역화로 인해 종종 발생시키는 근거 없는/환각적 결론의 문제를 해결하고, 다단계 비디오 추론 능력을 강화하는 것을 목표로 합니다.

#Review #Video Reasoning #Multimodal Large Language Models (MLLMs)#Reinforcement Learning (RLVR)#Evidence Grounding #Multi-step Reasoning #Frame Retrieval #Dataset Construction #Progressive Learning

2025년 10월 24일

[논문리뷰] Training Vision-Language Process Reward Models for Test-Time Scaling in Multimodal Reasoning: Key Insights and Lessons Learned

이 논문은 대규모 언어 모델(LLM)의 추론 신뢰성을 향상시키는 프로세스 보상 모델(PRM)을 시각-언어 모델(VLM) 영역으로 확장하고자 합니다.

#Review #Vision-Language Models (VLMs)#Process Reward Models (PRMs)#Multimodal Reasoning #Test-Time Scaling (TTS)#Process Supervision #Dataset Construction #Perception Errors #MCTS

2025년 10월 2일