최신 포스트

[Open WebUI] JSON.parse(JSON.stringify()) 를 structuredClone으로 교체

Chat.svelte의 7곳에서 깊은 복사 방식을 네이티브 structuredClone API로 변경하여 성능 2배 개선.

#Open WebUI #Svelte #JavaScript #Performance #Deep Clone

2026년 3월 1일

[Open WebUI] CodeBlock 토큰 비교 fast-path 최적화

JSON.stringify 대신 O(1) 필드 비교로 스트리밍 렌더링 성능 개선

#Open WebUI #Svelte #Rendering Optimization #Performance

2026년 3월 1일

[논문리뷰] dLLM: Simple Diffusion Language Modeling

이 논문은 확산 언어 모델(DLM) 의 훈련, 추론, 평가를 아우르는 통합된 오픈소스 프레임워크인 dLLM 을 제공하는 것을 목표로 합니다. DLM 연구의 진입 장벽을 낮추고, 기존 모델의 재현, 파인튜닝, 비교를 용이하게 하며, 새로운 DLM 설계 통합을 단순화하고자 합니다.

#Review #Diffusion Language Models #Open-source Framework #Modular Design #Masked Diffusion #Block Diffusion #Language Model Finetuning #Efficient Inference #Evaluation Pipeline

2026년 3월 1일

[논문리뷰] Vectorizing the Trie: Efficient Constrained Decoding for LLM-based Generative Retrieval on Accelerators

LLM 기반 생성형 검색(Generative Retrieval)은 추천 시스템의 강력한 패러다임이지만, 산업 환경에서 요구되는 출력 공간 제약(constrained output space) 을 기본 자기회귀 디코딩(autoregressive decoding) 이 지원하지 못하는 문제가 있습니다.

#Review #Generative Retrieval #Constrained Decoding #Trie #Sparse Matrix #TPU #GPU #Recommendation Systems #LLM

2026년 3월 1일

[논문리뷰] SenCache: Accelerating Diffusion Model Inference via Sensitivity-Aware Caching

확산 모델의 추론 과정을 가속화하는 것이 목표입니다. 특히, 기존의 휴리스틱 기반 캐싱 방법들이 가진 이론적 근거 부족과 정적 캐싱 스케줄의 한계를 극복하고, 모델 출력 품질을 유지하면서 계산 비용을 줄일 수 있는 원칙적인(principled) 민감도 기반 캐싱 프레임워크 를 제안합니다.

#Review #Diffusion Models #Inference Acceleration #Caching #Sensitivity Analysis #Dynamic Caching #Video Generation #Denoising

2026년 3월 1일

[논문리뷰] Ref-Adv: Exploring MLLM Visual Reasoning in Referring Expression Tasks

본 연구는 기존 참조 표현 이해(REC) 벤치마크( RefCOCO/+/g )가 짧은 표현, 적은 방해물, 중복 설명으로 인한 grounding shortcut 등으로 MLLM 의 진정한 시각적 추론 및 접지 능력을 제대로 평가하지 못한다는 문제점을 해결하고자 합니다.

#Review #Referring Expression Comprehension #MLLM #Visual Reasoning #Benchmark Dataset #Hard Distractors #Grounding Shortcuts #Chain-of-Thought #Negation

2026년 3월 1일

[논문리뷰] Recovered in Translation: Efficient Pipeline for Automated Translation of Benchmarks and Datasets

현재 다국어 LLM 평가 의 신뢰도를 저해하는 번역 벤치마크의 일관성 없는 품질(의미론적 드리프트 및 문맥 손실) 문제를 해결하는 것입니다. 본 연구는 데이터셋과 벤치마크를 확장 가능하고 고품질 로 번역하며, 원본 작업 구조와 언어적 뉘앙스를 보존하는 완전 자동화된 프레임워크를 제시하는 것을 목표로 합니다.

#Review #Automated Translation #Large Language Models #Multilingual Benchmarks #Benchmark Quality #Test-time Scaling #Universal Self-Improvement #Translation Ranking #Eastern European Languages

2026년 3월 1일

[논문리뷰] Mode Seeking meets Mean Seeking for Fast Long Video Generation

본 논문은 몇 초 길이의 단편 비디오 생성에서 분 단위 길이의 장편 비디오 생성으로 확장할 때 발생하는 주요 병목 현상을 해결하고자 합니다.

#Review #Long Video Generation #Diffusion Models #Mode Seeking #Mean Seeking #Decoupled Diffusion Transformer #Flow Matching #Distribution Matching #Video Synthesis

2026년 3월 1일

[논문리뷰] Memory Caching: RNNs with Growing Memory

본 논문은 고정된 메모리 크기 로 인해 장문 시퀀스에서 과거 정보를 잊어버리는 Recurrent Neural Networks (RNNs)의 한계를 해결하고자 합니다.

#Review #Recurrent Neural Networks #Memory Caching #Sequence Modeling #Long-Context #Transformers #Linear Attention #Language Modeling #Retrieval Tasks

2026년 3월 1일

[논문리뷰] LongVideo-R1: Smart Navigation for Low-cost Long Video Understanding

본 논문은 낮은 컴퓨팅 예산 으로 장시간 비디오를 효율적으로 이해하는 과제를 해결하는 것을 목표로 합니다.

#Review #Long Video Understanding #MLLM Agent #Active Learning #Reinforcement Learning #Chain-of-Thought #Video Navigation #Computational Efficiency

2026년 3월 1일

[논문리뷰] LK Losses: Direct Acceptance Rate Optimization for Speculative Decoding

본 연구는 추론 가속화를 위한 투기적 디코딩(speculative decoding) 에서 드래프트 모델의 토큰 수락률(acceptance rate) 을 직접적으로 최적화하는 새로운 훈련 목표인 LK 손실(LK losses) 을 제안합니다.

#Review #Speculative Decoding #LLM Inference #Acceptance Rate #KL Divergence #Total Variation Distance #Loss Functions #Draft Model Training #Adaptive Learning

2026년 3월 1일

[논문리뷰] InfoNCE Induces Gaussian Distribution

본 논문은 InfoNCE 손실 함수 를 사용하여 학습된 표현(representations)이 실제 어떤 분포를 따르는지에 대한 근본적인 질문에 답하고, 이러한 표현들이 가우시안 분포 를 나타내는 이유에 대한 이론적 설명을 제공하는 것을 목표로 합니다.

#Review #Contrastive Learning #InfoNCE Loss #Gaussian Distribution #Representation Learning #Self-Supervised Learning #Hyperspherical Uniformity #Thin-Shell Concentration

2026년 3월 1일

[논문리뷰] Enhancing Spatial Understanding in Image Generation via Reward Modeling

본 연구는 복잡한 공간 관계가 포함된 텍스트 프롬프트에서 현재 Text-to-Image(T2I) 모델 이 직면하는 한계를 해결하고, 생성된 이미지의 공간적 정확도를 향상시키는 것을 목표로 합니다.

#Review #Image Generation #Reward Modeling #Spatial Understanding #Reinforcement Learning #Visual Language Models #Text-to-Image #Preference Learning

2026년 3월 1일

[논문리뷰] DLEBench: Evaluating Small-scale Object Editing Ability for Instruction-based Image Editing Model

현재 Instruction-based Image Editing Models (IIEMs)가 작은 객체 편집에서 성능이 충분히 탐구되지 않았음을 지적하며, 정확한 로컬 편집 및 세부사항 개선 을 위한 IIEMs의 작은 객체 편집 능력 을 평가하는 전용 벤치마크를 구축하는 것을 목표로 합니다.

#Review #Image Editing #Instruction-based Models #Small Object Editing #Benchmark #Evaluation Metrics #Large Multimodal Models (LMMs)#Visual Consistency

2026년 3월 1일

[논문리뷰] Compositional Generalization Requires Linear, Orthogonal Representations in Vision Embedding Models

본 논문은 현대 비전 임베딩 모델이 훈련 중 접하지 못한 개념 조합에 대해 합성적으로 일반화하기 위해 어떤 본질적인 표현 특성을 가져야 하는지 규명하는 것을 목표로 합니다.

#Review #Compositional Generalization #Vision-Language Models #Linear Representations #Orthogonal Representations #Neural Networks #Embedding Geometry #CLIP

2026년 3월 1일

[논문리뷰] CiteAudit: You Cited It, But Did You Read It? A Benchmark for Verifying Scientific References in the LLM Era

대규모 언어 모델(LLM)이 생성하는 그럴듯하지만 실제로는 존재하지 않는 참고문헌 환각(hallucinated references) 문제를 해결하는 것을 목표로 합니다.

#Review #LLM Hallucination #Citation Verification #Multi-Agent System #Benchmark #Fact Checking #Scientific Integrity #Information Retrieval #Qwen3-VL

2026년 3월 1일

[논문리뷰] CUDA Agent: Large-Scale Agentic RL for High-Performance CUDA Kernel Generation

본 논문은 GPU 커널 최적화의 고도로 전문화된 특성과 torch.compile 과 같은 기존 컴파일러 기반 시스템 대비 LLM의 경쟁력 부족 문제를 해결하는 것을 목표로 합니다.

#Review #CUDA Kernel Generation #Agentic Reinforcement Learning #Large Language Models (LLMs)#GPU Optimization #Performance Tuning #Deep Learning Infrastructure #Program Synthesis

2026년 3월 1일

[논문리뷰] Accelerating Masked Image Generation by Learning Latent Controlled Dynamics

마스크 이미지 생성 모델(MIGMs)의 느린 생성 속도, 특히 양방향 어텐션의 다단계 계산으로 인한 비효율성 문제를 해결하는 것을 목표로 합니다. 기존의 캐싱 기반 가속화 방법론이 가진 낮은 표현력과 샘플링 정보 미고려 문제를 극복하고, 모델 품질 저하를 최소화하면서 MIGMs의 가속화를 달성하고자 합니다.

#Review #Masked Image Generation #Model Acceleration #Latent Dynamics Learning #Feature Prediction #Transformer Efficiency #Image Synthesis

2026년 3월 1일

[Open WebUI] requestAnimationFrame으로 스트리밍 중 getContents() 디바운싱

스트리밍 토큰마다 실행되던 무거운 콘텐츠 스캔을 requestAnimationFrame으로 프레임당 1회로 제한한 PR 분석.

#Open WebUI #Frontend #requestAnimationFrame #Debounce #Streaming #Svelte

2026년 3월 1일

[Open WebUI] CodeEditor에서 EditorView 미해제로 인한 메모리 누수 수정

CodeMirror EditorView를 컴포넌트 해제 시 destroy하지 않아 발생하던 메모리 누수를 수정하고, 언어 등록을 모듈 수준으로 분리한 분석.

#Open WebUI #Svelte #CodeMirror #Memory Leak #Performance #JavaScript

2026년 3월 1일