[논문리뷰] Mode Seeking meets Mean Seeking for Fast Long Video Generation본 논문은 몇 초 길이의 단편 비디오 생성에서 분 단위 길이의 장편 비디오 생성으로 확장할 때 발생하는 주요 병목 현상을 해결하고자 합니다.#Review#Long Video Generation#Diffusion Models#Mode Seeking#Mean Seeking#Decoupled Diffusion Transformer#Flow Matching#Distribution Matching#Video Synthesis2026년 3월 1일댓글 수 로딩 중
[논문리뷰] Memory Caching: RNNs with Growing Memory본 논문은 고정된 메모리 크기 로 인해 장문 시퀀스에서 과거 정보를 잊어버리는 Recurrent Neural Networks (RNNs)의 한계를 해결하고자 합니다.#Review#Recurrent Neural Networks#Memory Caching#Sequence Modeling#Long-Context#Transformers#Linear Attention#Language Modeling#Retrieval Tasks2026년 3월 1일댓글 수 로딩 중
[논문리뷰] LongVideo-R1: Smart Navigation for Low-cost Long Video Understanding본 논문은 낮은 컴퓨팅 예산 으로 장시간 비디오를 효율적으로 이해하는 과제를 해결하는 것을 목표로 합니다.#Review#Long Video Understanding#MLLM Agent#Active Learning#Reinforcement Learning#Chain-of-Thought#Video Navigation#Computational Efficiency2026년 3월 1일댓글 수 로딩 중
[논문리뷰] LK Losses: Direct Acceptance Rate Optimization for Speculative Decoding본 연구는 추론 가속화를 위한 투기적 디코딩(speculative decoding) 에서 드래프트 모델의 토큰 수락률(acceptance rate) 을 직접적으로 최적화하는 새로운 훈련 목표인 LK 손실(LK losses) 을 제안합니다.#Review#Speculative Decoding#LLM Inference#Acceptance Rate#KL Divergence#Total Variation Distance#Loss Functions#Draft Model Training#Adaptive Learning2026년 3월 1일댓글 수 로딩 중
[논문리뷰] InfoNCE Induces Gaussian Distribution본 논문은 InfoNCE 손실 함수 를 사용하여 학습된 표현(representations)이 실제 어떤 분포를 따르는지에 대한 근본적인 질문에 답하고, 이러한 표현들이 가우시안 분포 를 나타내는 이유에 대한 이론적 설명을 제공하는 것을 목표로 합니다.#Review#Contrastive Learning#InfoNCE Loss#Gaussian Distribution#Representation Learning#Self-Supervised Learning#Hyperspherical Uniformity#Thin-Shell Concentration2026년 3월 1일댓글 수 로딩 중
[논문리뷰] Enhancing Spatial Understanding in Image Generation via Reward Modeling본 연구는 복잡한 공간 관계가 포함된 텍스트 프롬프트에서 현재 Text-to-Image(T2I) 모델 이 직면하는 한계를 해결하고, 생성된 이미지의 공간적 정확도를 향상시키는 것을 목표로 합니다.#Review#Image Generation#Reward Modeling#Spatial Understanding#Reinforcement Learning#Visual Language Models#Text-to-Image#Preference Learning2026년 3월 1일댓글 수 로딩 중
[논문리뷰] DLEBench: Evaluating Small-scale Object Editing Ability for Instruction-based Image Editing Model현재 Instruction-based Image Editing Models (IIEMs)가 작은 객체 편집에서 성능이 충분히 탐구되지 않았음을 지적하며, 정확한 로컬 편집 및 세부사항 개선 을 위한 IIEMs의 작은 객체 편집 능력 을 평가하는 전용 벤치마크를 구축하는 것을 목표로 합니다.#Review#Image Editing#Instruction-based Models#Small Object Editing#Benchmark#Evaluation Metrics#Large Multimodal Models (LMMs)#Visual Consistency2026년 3월 1일댓글 수 로딩 중
[논문리뷰] Compositional Generalization Requires Linear, Orthogonal Representations in Vision Embedding Models본 논문은 현대 비전 임베딩 모델이 훈련 중 접하지 못한 개념 조합에 대해 합성적으로 일반화하기 위해 어떤 본질적인 표현 특성을 가져야 하는지 규명하는 것을 목표로 합니다.#Review#Compositional Generalization#Vision-Language Models#Linear Representations#Orthogonal Representations#Neural Networks#Embedding Geometry#CLIP2026년 3월 1일댓글 수 로딩 중
[논문리뷰] CiteAudit: You Cited It, But Did You Read It? A Benchmark for Verifying Scientific References in the LLM Era대규모 언어 모델(LLM)이 생성하는 그럴듯하지만 실제로는 존재하지 않는 참고문헌 환각(hallucinated references) 문제를 해결하는 것을 목표로 합니다.#Review#LLM Hallucination#Citation Verification#Multi-Agent System#Benchmark#Fact Checking#Scientific Integrity#Information Retrieval#Qwen3-VL2026년 3월 1일댓글 수 로딩 중
[논문리뷰] CUDA Agent: Large-Scale Agentic RL for High-Performance CUDA Kernel Generation본 논문은 GPU 커널 최적화의 고도로 전문화된 특성과 torch.compile 과 같은 기존 컴파일러 기반 시스템 대비 LLM의 경쟁력 부족 문제를 해결하는 것을 목표로 합니다.#Review#CUDA Kernel Generation#Agentic Reinforcement Learning#Large Language Models (LLMs)#GPU Optimization#Performance Tuning#Deep Learning Infrastructure#Program Synthesis2026년 3월 1일댓글 수 로딩 중
[논문리뷰] Accelerating Masked Image Generation by Learning Latent Controlled Dynamics마스크 이미지 생성 모델(MIGMs)의 느린 생성 속도, 특히 양방향 어텐션의 다단계 계산으로 인한 비효율성 문제를 해결하는 것을 목표로 합니다. 기존의 캐싱 기반 가속화 방법론이 가진 낮은 표현력과 샘플링 정보 미고려 문제를 극복하고, 모델 품질 저하를 최소화하면서 MIGMs의 가속화를 달성하고자 합니다.#Review#Masked Image Generation#Model Acceleration#Latent Dynamics Learning#Feature Prediction#Transformer Efficiency#Image Synthesis2026년 3월 1일댓글 수 로딩 중
[Open WebUI] requestAnimationFrame으로 스트리밍 중 getContents() 디바운싱스트리밍 토큰마다 실행되던 무거운 콘텐츠 스캔을 requestAnimationFrame으로 프레임당 1회로 제한한 PR 분석.#Open WebUI#Frontend#requestAnimationFrame#Debounce#Streaming#Svelte2026년 3월 1일댓글 수 로딩 중
[Open WebUI] CodeEditor에서 EditorView 미해제로 인한 메모리 누수 수정CodeMirror EditorView를 컴포넌트 해제 시 destroy하지 않아 발생하던 메모리 누수를 수정하고, 언어 등록을 모듈 수준으로 분리한 분석.#Open WebUI#Svelte#CodeMirror#Memory Leak#Performance#JavaScript2026년 3월 1일댓글 수 로딩 중
[Open WebUI] UserMessage에서 JSON 직렬화 대신 structuredClone과 빠른 경로 비교 적용JSON.parse/stringify 기반 깊은 복사와 비교를 structuredClone과 content 우선 비교로 대체하여 렌더링 성능을 개선한 최적화.#Open WebUI#Svelte#Performance#Frontend#JavaScript2026년 3월 1일댓글 수 로딩 중
[Open WebUI] 이벤트 이미터에서 DB 호출 비동기화, 중간 상태 저장 제거, elif 체인 적용소켓 이벤트 이미터의 동기 DB 호출을 asyncio.to_thread로 전환하고, 중간 상태 저장을 제거하며, if 체인을 elif로 변경한 3중 최적화 분석.#Open WebUI#Python#asyncio#Performance#Database#WebSocket2026년 3월 1일댓글 수 로딩 중
[Open WebUI] StatusHistory 비교에 O(1) 길이 검사 추가로 직렬화 비용 절감Open WebUI의 스트리밍 응답에서 매 프레임마다 JSON.stringify로 상태 히스토리를 비교하던 것에 배열 길이 사전 검사를 추가하여 불필요한 직렬화를 건너뛰는 최적화를 분석합니다.#Open WebUI#Svelte#Performance#Optimization#Streaming2026년 3월 1일댓글 수 로딩 중
[Open WebUI] JSON.parse(JSON.stringify())를 structuredClone으로 교체객체 딥 복사에 사용되던 JSON 직렬화/역직렬화 패턴을 네이티브 structuredClone API로 교체하고, 불필요한 복사를 제거한 PR을 분석합니다.#Open WebUI#Performance#JavaScript#structuredClone#Deep Copy2026년 3월 1일댓글 수 로딩 중
[Open WebUI] Sidebar 컴포넌트 메모리 누수 수정: onDestroy에서 onMount return으로 전환Svelte의 onDestroy와 onMount 사이의 타이밍 불일치로 인한 이벤트 리스너 메모리 누수를 수정한 분석.#Open WebUI#Svelte#Performance#Memory Leak#Event Listener2026년 3월 1일댓글 수 로딩 중
[Open WebUI] MentionList 컴포넌트 메모리 누수 수정비동기 onMount와 동기 onDestroy의 타이밍 문제로 인한 이벤트 리스너 누수 해결#Open WebUI#Svelte#Memory Leak#Performance2026년 3월 1일댓글 수 로딩 중
[Open WebUI] 스트리밍 중 메시지 리스트 재구성을 프레임당 1회로 제한requestAnimationFrame으로 메시지 리빌드를 쓰로틀링하여 CPU 사용량 감소#Open WebUI#Performance2026년 2월 28일댓글 수 로딩 중