[논문리뷰] Encoder-Free Human Motion Understanding via Structured Motion Descriptions본 논문은 모션을 구조화된 텍스트로 변환하는 결정론적 파이프라인과 이를 처리하는 LLM fine-tuning으로 구성된다. 제안된 SMD는 관절 각도 계산, 전역 궤적 설명, 그리고 이를 결합한 계층적 텍스트 생성 과정을 거치며, 모델이 별도의 인코더 없이 LLM의 사전 학습된 언어 지식을 활용하게 한다 .#Review#Human Motion Understanding#Large Language Models#Structured Motion Description#Biomechanics#LoRA#Motion Question Answering#Motion Captioning2026년 4월 23일댓글 수 로딩 중
[논문리뷰] Free Geometry: Refining 3D Reconstruction from Longer Versions of ItselfarXiv에 게시된 'Free Geometry: Refining 3D Reconstruction from Longer Versions of Itself' 논문에 대한 자세한 리뷰입니다.#Review#Test-Time Adaptation#Multi-View 3D Reconstruction#Self-Supervision#LoRA#Feature Consistency#Feed-Forward Models2026년 4월 15일댓글 수 로딩 중
[논문리뷰] AnomalyVFM -- Transforming Vision Foundation Models into Zero-Shot Anomaly DetectorsarXiv에 게시된 'AnomalyVFM -- Transforming Vision Foundation Models into Zero-Shot Anomaly Detectors' 논문에 대한 자세한 리뷰입니다.#Review#Zero-Shot Anomaly Detection#Vision Foundation Models#Synthetic Data Generation#LoRA#Confidence-Weighted Loss2026년 4월 9일댓글 수 로딩 중
[논문리뷰] Diffutron: A Masked Diffusion Language Model for Turkish LanguagearXiv에 게시된 'Diffutron: A Masked Diffusion Language Model for Turkish Language' 논문에 대한 자세한 리뷰입니다.#Review#Masked Diffusion Language Models#Turkish NLP#Non-Autoregressive Generation#LoRA#Instruction Tuning#Morphologically Rich Languages#Parameter Efficiency2026년 3월 29일댓글 수 로딩 중
[논문리뷰] AVControl: Efficient Framework for Training Audio-Visual ControlsarXiv에 게시된 'AVControl: Efficient Framework for Training Audio-Visual Controls' 논문에 대한 자세한 리뷰입니다.#Review#Audio-Visual Generation#Video Control#LoRA#Parallel Canvas Conditioning#Diffusion Models#Modularity#Efficiency2026년 3월 26일댓글 수 로딩 중
[Axolotl] LoRA 커널에 bias, dropout, DoRA, embedding 지원 추가Axolotl의 Triton LoRA 커널을 확장하여 bias 파라미터, dropout, DoRA(Weight-Decomposed LoRA), embedding 레이어를 지원하도록 개선한 분석.#Axolotl#LoRA#DoRA#Triton#LLM Training#Performance#PEFT2026년 3월 22일댓글 수 로딩 중
[Axolotl] ScatterMoE LoRA Triton 커널의 autotune 탐색 공간 축소ScatterMoE LoRA Triton 커널의 autotune 설정에서 불필요하게 큰 block size를 제거하여 컴파일 시간을 단축하고 shared memory 초과를 방지한 분석.#Axolotl#Triton#ScatterMoE#LoRA#Autotune#Performance#GPU2026년 3월 21일댓글 수 로딩 중
[Axolotl] ScatterMoE LoRA 최적화: 벤치마크, 커널 분할, autograd 통합ScatterMoE LoRA Triton 커널에 벤치마크 도구를 추가하고, large expert 모델에서 fused/split forward 자동 선택 및 autograd 통합을 최적화한 분석.#Axolotl#ScatterMoE#LoRA#Triton#MoE#Benchmark#GPU#Performance2026년 3월 19일댓글 수 로딩 중
[논문리뷰] 3DreamBooth: High-Fidelity 3D Subject-Driven Video Generation ModelarXiv에 게시된 '3DreamBooth: High-Fidelity 3D Subject-Driven Video Generation Model' 논문에 대한 자세한 리뷰입니다.#Review#3D-aware video generation#subject-driven customization#multi-view conditioning#video diffusion models#LoRA#temporal dynamics#3Dapter#3DreamBooth2026년 3월 19일댓글 수 로딩 중
[axolotl] Triton LoRA 커널 Autotune 테스트 안정화: pytest-xdist 환경에서의 모듈 격리 전략pytest-xdist 병렬 실행 시 sys.modules 공유로 인한 flaky 테스트를 _find_lora_ops_module 직접 패치 방식으로 해결한 사례를 분석합니다.#Axolotl#Triton#Testing#pytest#LoRA2026년 3월 19일댓글 수 로딩 중
[논문리뷰] Mixture of Style Experts for Diverse Image StylizationMi Zhou이 arXiv에 게시한 'Mixture of Style Experts for Diverse Image Stylization' 논문에 대한 자세한 리뷰입니다.#Review#Image Stylization#Mixture of Experts (MoE)#Diffusion Models#Semantic-aware Stylization#Style Transfer#LoRA2026년 3월 17일댓글 수 로딩 중
[논문리뷰] Efficient Reasoning on the EdgearXiv에 게시된 'Efficient Reasoning on the Edge' 논문에 대한 자세한 리뷰입니다.#Review#LLMs#Edge Computing#LoRA#Quantization#Budget Forcing#Switcher Module#Parallel Reasoning2026년 3월 17일댓글 수 로딩 중
[axolotl] Async GRPO 지원: vLLM 비동기 생성과 Importance Sampling으로 RLHF 학습 가속화axolotl에 Async GRPO를 도입하여 vLLM 생성과 학습을 병렬화하고, Importance Sampling 보정으로 분포 이동 문제를 해결한 대규모 기능 추가를 분석합니다.#Axolotl#GRPO#RLHF#vLLM#Async Training#LoRA2026년 3월 17일댓글 수 로딩 중
[논문리뷰] LookaheadKV: Fast and Accurate KV Cache Eviction by Glimpsing into the Future without GenerationarXiv에 게시된 'LookaheadKV: Fast and Accurate KV Cache Eviction by Glimpsing into the Future without Generation' 논문에 대한 자세한 리뷰입니다.#Review#KV Cache Eviction#Long Context LLM#Attention Score Prediction#LoRA#Parameter-Efficient#Time-to-First-Token2026년 3월 15일댓글 수 로딩 중
[논문리뷰] Accent Vector: Controllable Accent Manipulation for Multilingual TTS Without Accented DataarXiv에 게시된 'Accent Vector: Controllable Accent Manipulation for Multilingual TTS Without Accented Data' 논문에 대한 자세한 리뷰입니다.#Review#Text-To-Speech#Controllable Speech Synthesis#Accented Speech Generation#Accent Vector#Multilingual TTS#LoRA2026년 3월 12일댓글 수 로딩 중
[논문리뷰] ReMix: Reinforcement routing for mixtures of LoRAs in LLM finetuningarXiv에 게시된 'ReMix: Reinforcement routing for mixtures of LoRAs in LLM finetuning' 논문에 대한 자세한 리뷰입니다.#Review#LLM Finetuning#LoRA#Mixture of Experts (MoE)#Reinforcement Learning#Parameter-Efficient Finetuning (PEFT)#Routing#Weight Collapse2026년 3월 11일댓글 수 로딩 중
[논문리뷰] PureCC: Pure Learning for Text-to-Image Concept CustomizationarXiv에 게시된 'PureCC: Pure Learning for Text-to-Image Concept Customization' 논문에 대한 자세한 리뷰입니다.#Review#Text-to-Image#Concept Customization#Flow-based Models#Pure Learning#Model Preservation#Adaptive Guidance#LoRA2026년 3월 9일댓글 수 로딩 중
[논문리뷰] NLE: Non-autoregressive LLM-based ASR by Transcript EditingarXiv에 게시된 'NLE: Non-autoregressive LLM-based ASR by Transcript Editing' 논문에 대한 자세한 리뷰입니다.#Review#Non-Autoregressive ASR#LLM-based ASR#Transcript Editing#CTC#Transformer#LoRA#Real-time ASR#Inference Speed2026년 3월 9일댓글 수 로딩 중
[논문리뷰] StereoAdapter-2: Globally Structure-Consistent Underwater Stereo Depth EstimationarXiv에 게시된 'StereoAdapter-2: Globally Structure-Consistent Underwater Stereo Depth Estimation' 논문에 대한 자세한 리뷰입니다.#Review#Underwater Depth Estimation#Stereo Matching#State Space Model#Mamba Architecture#ConvSS2D#Data Synthesis#LoRA#Zero-shot Learning#Robotics2026년 2월 19일댓글 수 로딩 중
[논문리뷰] DDiT: Dynamic Patch Scheduling for Efficient Diffusion TransformersDeepti Ghadiyaram이 arXiv에 게시한 'DDiT: Dynamic Patch Scheduling for Efficient Diffusion Transformers' 논문에 대한 자세한 리뷰입니다.#Review#Diffusion Transformers#Dynamic Tokenization#Patch Scheduling#Inference Acceleration#Text-to-Image Generation#Text-to-Video Generation#Latent Manifold Analysis#LoRA2026년 2월 19일댓글 수 로딩 중
[논문리뷰] SALAD: Achieve High-Sparsity Attention via Efficient Linear Attention Tuning for Video Diffusion TransformerarXiv에 게시된 'SALAD: Achieve High-Sparsity Attention via Efficient Linear Attention Tuning for Video Diffusion Transformer' 논문에 대한 자세한 리뷰입니다.#Review#Video Diffusion Models#Sparse Attention#Linear Attention#Computational Efficiency#Transformer Tuning#Video Generation#LoRA#Gating Mechanism2026년 1월 25일댓글 수 로딩 중
[논문리뷰] DreamStyle: A Unified Framework for Video StylizationarXiv에 게시된 'DreamStyle: A Unified Framework for Video Stylization' 논문에 대한 자세한 리뷰입니다.#Review#Video Stylization#Unified Framework#Diffusion Models#LoRA#Data Curation#Multi-modal Input#Image-to-Video2026년 1월 6일댓글 수 로딩 중
[논문리뷰] PhyGDPO: Physics-Aware Groupwise Direct Preference Optimization for Physically Consistent Text-to-Video GenerationarXiv에 게시된 'PhyGDPO: Physics-Aware Groupwise Direct Preference Optimization for Physically Consistent Text-to-Video Generation' 논문에 대한 자세한 리뷰입니다.#Review#Text-to-Video Generation#Physics-Aware AI#Direct Preference Optimization#Groupwise Preference Learning#Vision-Language Model#LoRA2025년 12월 31일댓글 수 로딩 중
[논문리뷰] IC-Effect: Precise and Efficient Video Effects Editing via In-Context LearningarXiv에 게시된 'IC-Effect: Precise and Efficient Video Effects Editing via In-Context Learning' 논문에 대한 자세한 리뷰입니다.#Review#Video VFX Editing#In-Context Learning#Diffusion Transformers#Few-Shot Learning#LoRA#Spatiotemporal Tokenization#Instruction-Guided2025년 12월 17일댓글 수 로딩 중
[논문리뷰] Glance: Accelerating Diffusion Models with 1 SampleLinjie Li이 arXiv에 게시한 'Glance: Accelerating Diffusion Models with 1 Sample' 논문에 대한 자세한 리뷰입니다.#Review#Diffusion Models#Acceleration#Distillation#LoRA#Few-shot Learning#Phase-aware#Image Generation#Computational Efficiency2025년 12월 2일댓글 수 로딩 중
[논문리뷰] First Frame Is the Place to Go for Video Content CustomizationarXiv에 게시된 'First Frame Is the Place to Go for Video Content Customization' 논문에 대한 자세한 리뷰입니다.#Review#Video Generation#Content Customization#Few-shot Learning#LoRA#Vision-Language Models (VLMs)#First Frame Conditioning#Reference-based Generation2025년 11월 20일댓글 수 로딩 중
[논문리뷰] The Path Not Taken: RLVR Provably Learns Off the PrincipalsarXiv에 게시된 'The Path Not Taken: RLVR Provably Learns Off the Principals' 논문에 대한 자세한 리뷰입니다.#Review#Reinforcement Learning#Large Language Models#Parameter-Efficient Fine-Tuning#Optimization Bias#Spectral Geometry#Model Sparsity#LoRA2025년 11월 11일댓글 수 로딩 중
[논문리뷰] Omni-AVSR: Towards Unified Multimodal Speech Recognition with Large Language ModelsarXiv에 게시된 'Omni-AVSR: Towards Unified Multimodal Speech Recognition with Large Language Models' 논문에 대한 자세한 리뷰입니다.#Review#Multimodal Speech Recognition#Large Language Models#Audio-Visual Speech Recognition#LoRA#Matryoshka Representation Learning#Elastic Inference#Parameter-Efficient Adaptation2025년 11월 10일댓글 수 로딩 중
[논문리뷰] MisSynth: Improving MISSCI Logical Fallacies Classification with Synthetic DataNadiya Shvai이 arXiv에 게시한 'MisSynth: Improving MISSCI Logical Fallacies Classification with Synthetic Data' 논문에 대한 자세한 리뷰입니다.#Review#Health Misinformation#Logical Fallacy Classification#Synthetic Data Generation#Large Language Models (LLMs)#Retrieval-Augmented Generation (RAG)#Parameter-Efficient Fine-tuning (PEFT)#LoRA#MISSCI Benchmark2025년 11월 9일댓글 수 로딩 중
[논문리뷰] Concerto: Joint 2D-3D Self-Supervised Learning Emerges Spatial RepresentationsarXiv에 게시된 'Concerto: Joint 2D-3D Self-Supervised Learning Emerges Spatial Representations' 논문에 대한 자세한 리뷰입니다.#Review#Self-Supervised Learning#2D-3D Fusion#Spatial Representation#Point Cloud#Image Features#Multimodal Learning#Semantic Segmentation#LoRA2025년 10월 28일댓글 수 로딩 중
[논문리뷰] Annotation-Efficient Universal Honesty AlignmentJingtong Wu이 arXiv에 게시한 'Annotation-Efficient Universal Honesty Alignment' 논문에 대한 자세한 리뷰입니다.#Review#LLM Honesty Alignment#Confidence Calibration#Annotation Efficiency#Self-Consistency#Elicitation-Then-Calibration (EliCal)#HonestyBench#LoRA#Trustworthy AI2025년 10월 21일댓글 수 로딩 중
[논문리뷰] LightsOut: Diffusion-based Outpainting for Enhanced Lens Flare RemovalarXiv에 게시된 'LightsOut: Diffusion-based Outpainting for Enhanced Lens Flare Removal' 논문에 대한 자세한 리뷰입니다.#Review#Lens Flare Removal#Diffusion Models#Image Outpainting#Deep Learning#Image Restoration#Preprocessing#LoRA2025년 10월 20일댓글 수 로딩 중
[논문리뷰] TC-LoRA: Temporally Modulated Conditional LoRA for Adaptive Diffusion ControlAdityan Jothi이 arXiv에 게시한 'TC-LoRA: Temporally Modulated Conditional LoRA for Adaptive Diffusion Control' 논문에 대한 자세한 리뷰입니다.#Review#Diffusion Models#Conditional Generation#LoRA#Hypernetwork#Dynamic Weight Adaptation#Generative AI#Controllable Generation2025년 10월 13일댓글 수 로딩 중
[논문리뷰] MixReasoning: Switching Modes to ThinkarXiv에 게시된 'MixReasoning: Switching Modes to Think' 논문에 대한 자세한 리뷰입니다.#Review#LLM Reasoning#Chain-of-Thought#Efficiency#LoRA#Adaptive Reasoning#Token Uncertainty#Dynamic Switching#Reasoning Compression2025년 10월 8일댓글 수 로딩 중
[논문리뷰] UniVid: Unifying Vision Tasks with Pre-trained Video Generation ModelsYuchao Gu이 arXiv에 게시한 'UniVid: Unifying Vision Tasks with Pre-trained Video Generation Models' 논문에 대한 자세한 리뷰입니다.#Review#Unified Vision Modeling#Video Generation#Diffusion Transformer#Supervised Fine-tuning#Cross-modal#Cross-source Tasks#Visual Sentences#LoRA2025년 9월 29일댓글 수 로딩 중
[논문리뷰] ObjFiller-3D: Consistent Multi-view 3D Inpainting via Video Diffusion ModelsBeiqi Chen이 arXiv에 게시한 'ObjFiller-3D: Consistent Multi-view 3D Inpainting via Video Diffusion Models' 논문에 대한 자세한 리뷰입니다.#Review#3D Inpainting#Multi-view Consistency#Video Diffusion Models#3D Object Completion#Generative Models#LoRA#3D Gaussian Splatting2025년 8월 27일댓글 수 로딩 중
[논문리뷰] Noise Hypernetworks: Amortizing Test-Time Compute in Diffusion ModelsZeynep Akata이 arXiv에 게시한 'Noise Hypernetworks: Amortizing Test-Time Compute in Diffusion Models' 논문에 대한 자세한 리뷰입니다.#Review#Diffusion Models#Hypernetworks#Test-Time Optimization#Reward-Guided Generation#Latent Space Optimization#LoRA#Generative AI2025년 8월 14일댓글 수 로딩 중
[논문리뷰] Omni-Effects: Unified and Spatially-Controllable Visual Effects GenerationXiaokun Feng이 arXiv에 게시한 'Omni-Effects: Unified and Spatially-Controllable Visual Effects Generation' 논문에 대한 자세한 리뷰입니다.#Review#Visual Effects#Video Generation#LoRA#Mixture of Experts#Spatial Control#Diffusion Models#Multi-VFX2025년 8월 12일댓글 수 로딩 중
[논문리뷰] OpenMed NER: Open-Source, Domain-Adapted State-of-the-Art Transformers for Biomedical NER Across 12 Public DatasetsMaziyarPanahi이 arXiv에 게시한 'OpenMed NER: Open-Source, Domain-Adapted State-of-the-Art Transformers for Biomedical NER Across 12 Public Datasets' 논문에 대한 자세한 리뷰입니다.#Review#Biomedical NER#Transformer#Domain Adaptation#LoRA#Open-Source#Named Entity Recognition#Healthcare AI2025년 8월 7일댓글 수 로딩 중
[논문리뷰] DreamVVT: Mastering Realistic Video Virtual Try-On in the Wild via a Stage-Wise Diffusion Transformer FrameworkChao Liang이 arXiv에 게시한 'DreamVVT: Mastering Realistic Video Virtual Try-On in the Wild via a Stage-Wise Diffusion Transformer Framework' 논문에 대한 자세한 리뷰입니다.#Review#Video Virtual Try-On#Diffusion Transformers#Stage-Wise Framework#Vision-Language Models#LoRA#Temporal Consistency#Garment Preservation2025년 8월 7일댓글 수 로딩 중
[논문리뷰] AlignGuard-LoRA: Alignment-Preserving Fine-Tuning via Fisher-Guided Decomposition and Riemannian-Geodesic Collision RegularizationAman Chadha이 arXiv에 게시한 'AlignGuard-LoRA: Alignment-Preserving Fine-Tuning via Fisher-Guided Decomposition and Riemannian-Geodesic Collision Regularization' 논문에 대한 자세한 리뷰입니다.#Review#Alignment Preservation#Fine-Tuning#LoRA#Fisher Information Matrix#Catastrophic Forgetting#LLM Safety#Riemannian Geometry#Parameter-Efficient Learning2025년 8월 6일댓글 수 로딩 중