최신 포스트

[논문리뷰] ConceptMoE: Adaptive Token-to-Concept Compression for Implicit Compute Allocation

대규모 언어 모델(LLMs)이 모든 토큰에 균일하게 연산을 할당하여 비효율적인 연산 자원 사용을 초래하는 문제를 해결하는 것이 목표입니다.

#Review #MoE #LLMs #Adaptive Compression #Token Merging #Compute Allocation #Efficiency #Vision-Language Models #Continual Training

2026년 1월 29일

[논문리뷰] Beyond Imitation: Reinforcement Learning for Active Latent Planning

이 논문은 기존의 모방 기반 잠재 추론 방식이 여러 동등한 추론 경로 중 하나만을 학습하여 성능 저하 및 훈련-테스트 간 격차를 초래하는 문제를 해결하고자 합니다.

#Review #Large Language Models (LLMs)#Chain-of-Thought (CoT)#Latent Reasoning #Reinforcement Learning (RL)#Variational Autoencoder (VAE)#Active Planning #Numerical Reasoning #Coherence Reward

2026년 1월 29일

[논문리뷰] AgentLongBench: A Controllable Long Benchmark For Long-Contexts Agents via Environment Rollouts

이 논문은 동적으로 변화하는 컨텍스트 내에서 장문 컨텍스트 LLM (Large Language Model) 기반 에이전트의 오랜 기간에 걸친 일관성(long-horizon consistency) 및 계획(planning) 능력을 평가하기 위한 표준화된 벤치마크의 부재를 해결합니다.

#Review #Long-Context LLMs #Autonomous Agents #Benchmark #Environment Rollouts #State Tracking #Tool Use #Memory Evaluation #Lateral Thinking Puzzles

2026년 1월 29일

[pydantic-ai] OpenAI prompt_cache_retention 리터럴 타입 오류 수정

OpenAI SDK의 타입 스텁이 'in-memory'로 정의했지만 실제 API는 'in_memory'를 요구하는 불일치를 수정한 사례를 분석합니다.

#pydantic-ai #OpenAI #Type Safety #Bug Fix #API

2026년 1월 29일

[Open WebUI] 메모리 업데이트 후 불필요한 재조회 쿼리 제거

update_memory_by_id에서 커밋 후 별도 세션으로 다시 조회하던 패턴을 db.refresh로 대체하여 쿼리 수를 절반으로 줄인 최적화.

#Open WebUI #Python #Performance #SQLAlchemy #Database

2026년 1월 29일

[Open WebUI] DB 쿼리 최적화: 루프 삭제를 벌크 연산으로 교체

Open WebUI의 functions, feedbacks, groups 모델에서 불필요한 재조회와 루프 기반 삭제를 제거하여 데이터베이스 쿼리를 최적화한 PR 분석.

#Open WebUI #Database #SQLAlchemy #Bulk Delete #Performance

2026년 1월 29일

[Open WebUI] SCIM 그룹 변환에서 N+1 쿼리를 배치 조회로 제거

SCIM group_to_scim 함수에서 멤버마다 개별 쿼리를 보내던 N+1 문제를 단일 배치 조회로 해결한 최적화 분석.

#Open WebUI #Python #Performance #N+1 Query #SCIM

2026년 1월 29일

[Grafana Loki] JSON 파서에서 bytes.Runes() 할당을 in-place UTF-8 디코딩으로 제거

쿼리 엔진 워커의 JSON 키 정제 과정에서 매번 새 슬라이스를 할당하던 bytes.Runes()를 utf8.DecodeRune으로 교체하고, JSON 파서 재사용과 요청 키 프리필터링을 추가한 최적화 분석.

#Grafana Loki #Go #Performance #Memory Allocation #JSON Parser

2026년 1월 29일

[pytest] 캐시 디렉터리 생성 로직 단순화 — 원자적 생성 함수 추출

pytest 캐시 디렉터리 생성을 _make_cachedir() 함수로 추출하고 TemporaryDirectory 대신 shutil.rmtree로 정리

#Python #pytest #Refactoring #File System #Concurrency

2026년 1월 29일

[Open WebUI] users.py의 5개 업데이트 메서드에서 중복 SELECT 쿼리 제거

UPDATE 후 별도 SELECT로 재조회하던 패턴을 fetch-modify-refresh 패턴으로 통일하여 쿼리 수를 절반으로 줄인 최적화.

#Open WebUI #Python #Performance #SQLAlchemy #Database

2026년 1월 29일

[논문리뷰] UPLiFT: Efficient Pixel-Dense Feature Upsampling with Local Attenders

본 연구는 사전 훈련된 비전 백본으로부터 밀도 높은 특징(dense features)을 효율적으로 생성하는 과정에서 발생하는 계산 비용 문제 를 해결하고자 합니다.

#Review #Feature Upsampling #Local Attender #Pixel-Dense Features #Iterative Upsampling #Vision Transformer #Efficiency #Generative AI #Semantic Segmentation

2026년 1월 28일

[논문리뷰] Spark: Strategic Policy-Aware Exploration via Dynamic Branching for Long-Horizon Agentic Learning

본 논문은 대규모 언어 모델(LLM) 기반의 에이전트가 장기적인 태스크를 수행할 때 발생하는 비효율적인 탐색 문제를 해결하는 것을 목표로 합니다. 기존 RL 방법론은 컴퓨팅 자원을 중간 단계에 균일하게 할당하여 중요하지 않은 단계에서 자원을 낭비하고 고품질 궤적 확보에 실패하는 한계를 가지고 있습니다.

#Review #Agentic AI #Reinforcement Learning #Long-Horizon Tasks #Dynamic Branching #Strategic Exploration #LLM Agents #Sample Efficiency #Policy Optimization

2026년 1월 28일

[논문리뷰] SketchDynamics: Exploring Free-Form Sketches for Dynamic Intent Expression in Animation Generation

본 논문은 기존 애니메이션 도구가 스케치를 고정된 명령으로 제한하여 자유로운 표현과 인간의 의도 반영에 한계가 있다는 문제를 해결합니다. 자유형 스케치를 통해 동적 의도(dynamic intent)를 효과적으로 포착하고, 이를 활용하여 애니메이션 콘텐츠를 자동으로 생성하는 인터랙션 패러다임을 탐구하는 것을 목표로 합니다.

#Review #Animation Generation #Free-Form Sketching #Human-AI Interaction #Vision-Language Models (VLMs)#Dynamic Intent Expression #Motion Graphics #Iterative Refinement #Storyboard

2026년 1월 28일

[논문리뷰] Shallow-π: Knowledge Distillation for Flow-based VLAs

본 논문은 대규모 Vision-Language-Action (VLA) 모델 의 높은 연산 비용으로 인해 엣지 디바이스에서의 실시간 배포가 어려운 문제를 해결하고자 합니다.

#Review #Knowledge Distillation #Flow-based VLA #Transformer Compression #Real-time Robotics #Edge AI #Vision-Language-Action Models #Inference Efficiency

2026년 1월 28일

[논문리뷰] SERA: Soft-Verified Efficient Repository Agents

본 논문은 폐쇄형 시스템 대비 오픈 소스 코딩 에이전트의 강점인 사설 코드베이스 특화 능력 을 저비용으로 실현하는 것을 목표로 합니다. 기존 훈련 방식의 높은 비용과 복잡성으로 인해 이론에 머물렀던 이점을 극복하고, 효율적인 데이터 생성 및 학습 방법론 을 제시하여 실질적인 적용 가능성을 입증하고자 합니다.

#Review #Coding Agents #Synthetic Data Generation #Repository Specialization #Supervised Finetuning #Soft Verification #Cost-Efficiency #SWE-bench

2026년 1월 28일

[논문리뷰] SE-DiCoW: Self-Enrolled Diarization-Conditioned Whisper

본 논문은 Diarization-Conditioned Whisper (DiCoW)의 핵심 한계점인 STNO (Silence-Target-Non-target-Overlap) 마스크의 모호성 을 해결하고자 합니다.

#Review #Target-Speaker ASR #DiCoW #Whisper Model #Multi-speaker ASR #Self-enrollment #Cross-attention #Speech Diarization

2026년 1월 28일

[논문리뷰] Reinforcement Learning via Self-Distillation

대규모 언어 모델(LLM)의 강화 학습(RL) 후 훈련에서 발생하는 심각한 신용 할당(credit assignment) 병목 현상 을 해결하는 것이 목표입니다. 특히, 코드 생성이나 수학 문제 해결과 같은 검증 가능한 도메인 에서 스칼라 보상 이 아닌 풍부한 텍스트 피드백 을 활용하여 학습 효율성을 극대화하고자 합니다.

#Review #Reinforcement Learning #Self-Distillation #Large Language Models (LLMs)#Rich Feedback #Credit Assignment #Policy Optimization #RLHF #Code Generation #Test-Time Training

2026년 1월 28일

[논문리뷰] RIR-Mega-Speech: A Reverberant Speech Corpus with Comprehensive Acoustic Metadata and Reproducible Evaluation

본 논문은 잔향 스피치 처리 분야에서 투명한 음향 메타데이터와 용이한 재현성을 갖춘 표준화된 평가 자원의 부족 문제를 해결하고자 합니다.

#Review #Reverberant Speech #Speech Corpus #Acoustic Metadata #Reproducible Research #ASR Evaluation #Room Impulse Response #Speech Recognition

2026년 1월 28일

[논문리뷰] OmegaUse: Building a General-Purpose GUI Agent for Autonomous Task Execution

본 논문은 모바일 및 데스크톱 환경 모두에서 자율적인 태스크 실행을 위한 범용 GUI(Graphical User Interface) 에이전트 모델인 OmegaUse 를 구축하는 것을 목표로 합니다.

#Review #GUI Agent #Multimodal AI #MoE #Data Synthesis #Reinforcement Learning #Cross-Platform #Benchmarking

2026년 1월 28일

[논문리뷰] Linear representations in language models can change dramatically over a conversation

본 연구는 대규모 언어 모델(LLM) 내에서 선형 표현(Linear representations) , 특히 사실성(factuality)이나 윤리(ethics)와 같은 고수준 개념을 나타내는 표현이 대화 과정에서 어떻게 동적으로 변화 하는지 조사하는 것을 목표로 합니다.

#Review #Language Models #Representation Analysis #Interpretability #In-Context Learning #Representation Dynamics #Factuality #Conversational AI #Activation Steering

2026년 1월 28일