최신 포스트

[논문리뷰] HippoCamp: Benchmarking Contextual Agents on Personal Computers

HippoCamp는 100명 이상의 실제 사용자 데이터를 기반으로 2,000개 이상의 이질적인 파일을 포함하는 3개의 대표적인 개인 컴퓨팅 환경을 구축하였습니다. 각 환경에는 Factual Retention 및 Profiling 태스크를 위한 581개의 QA 쌍이 존재하며, 이를 위해 46.1K개의 정교한 주석(Annotation)이 제공됩니다.

#Review #Multimodal Agents #File-System #Contextual Benchmarking #Personalized Memory #Profiling #Factual Retention

2026년 4월 1일

[논문리뷰] GaussianGPT: Towards Autoregressive 3D Gaussian Scene Generation

본 논문은 기존 3D 생성 모델들이 주로 사용하는 전체적(holistic)인 Denoising이나 Diffusion 방식이 3D 환경의 점진적 구축과 편집에 부적합하다는 문제를 해결하고자 한다. 기존 방식은 고정된 장면을 한 번에 생성하는 경향이 있어, 실제 환경처럼 점진적으로 확장하거나 수정하는 유연성이 부족하다.

#Review #3D Gaussian Splatting #Autoregressive Modeling #Scene Generation #Transformer #Vector Quantization #3D Scene Completion

2026년 4월 1일

[논문리뷰] Embarrassingly Simple Self-Distillation Improves Code Generation

본 논문은 LLM의 코드 생성 능력을 향상하기 위해 외부의 고품질 인간 작성 데이터나 복잡한 강화 학습(RL) 파이프라인 없이 모델 스스로 개선될 수 있는지에 대한 의문을 제기합니다.

#Review #Self-Distillation #Code Generation #Large Language Models #Precision-Exploration Conflict #Supervised Fine-Tuning #Temperature Scaling #Truncation

2026년 4월 1일

[논문리뷰] ClawKeeper: Comprehensive Safety Protection for OpenClaw Agents Through Skills, Plugins, and Watchers

본 논문은 OpenClaw와 같은 현대 자율 에이전트 런타임이 가지는 높은 권한 모델로 인해 발생하는 시스템 수준의 보안 취약점을 해결하기 위해 제안되었습니다.

#Review #Autonomous Agents #OpenClaw #Security Framework #Watcher Architecture #Safety-Utility Tradeoff #Behavioral Scanning #Runtime Enforcement

2026년 4월 1일

[논문리뷰] Benchmarking and Mechanistic Analysis of Vision-Language Models for Cross-Depiction Assembly Instruction Alignment

본 논문은 지능형 조립 어시스턴트가 2D 다이어그램과 실제 카메라 영상을 정렬하는 과정에서 겪는 Depiction Gap 문제를 해결하기 위해 수행되었습니다.

#Review #Vision-Language Models #Cross-depiction Alignment #Assembly Guidance #Diagram-to-video Matching #Mechanistic Analysis

2026년 4월 1일

[논문리뷰] AI Generalisation Gap In Comorbid Sleep Disorder Staging

본 연구에서는 SE-ResNet 블록과 Bi-LSTM 레이어를 결합하여 시계열 EEG 데이터의 특징을 추출하고 시간적 의존성을 모델링하는 프레임워크를 제안합니다. 저자들은 새로 구축한 iSLEEPS 데이터셋을 활용하여 기존의 헬스케어 기반 모델들과 성능을 비교하였습니다.

#Review #Sleep Staging #Ischemic Stroke #Explainable AI #Grad-CAM #Deep Learning #Clinical Generalization #iSLEEPS

2026년 4월 1일

[논문리뷰] A Survey of On-Policy Distillation for Large Language Models

본 논문은 기존의 off-policy LLM 증류(distillation) 방식이 가진 근본적인 train-test mismatch와 그로 인한 exposure bias 문제를 해결하고자 합니다.

#Review #On-Policy Distillation #Large Language Models #Knowledge Distillation #Exposure Bias #f-Divergence #Sequence-Level Learning #Reinforcement Learning

2026년 4월 1일

[openclaw] Vitest 모듈 로딩 최적화 및 테스트 병렬성 증대를 통한 CI 성능 개선

Vitest 테스트 모듈 로딩 최적화와 병렬 처리 확대를 통해 CI 빌드 시간을 단축합니다.

#Vitest #CI #Performance #Optimization #Testing

2026년 4월 1일

[sglang] SGLang: ROCm 환경에서 Qwen3-VL 디코딩 성능 극대화를 위한 커널 퓨전 최적화

4개의 개별 커널 호출을 단일 HIP 커널로 통합하여 Qwen3-VL 모델의 디코딩 지연 시간을 획기적으로 개선한 최적화 사례 분석.

#SGLang #ROCm #Kernel Fusion #LLM #Performance Optimization

2026년 4월 1일

[Loki] Kafka 파티션 불필요한 Shuffle Sharding 제거

ShardSize가 0일 때 불필요한 shuffle shard 생성을 건너뛰어 메모리 사용량 절감.

#Grafana Loki #Go #Performance #Kafka #Memory Optimization

2026년 4월 1일

[Open WebUI] ChatItem 사이드바 메모리 누수 수정

이벤트 리스너 정리와 공유 드래그 이미지로 사이드바 ChatItem의 메모리 누수 해결.

#Open WebUI #Svelte #Performance #Memory Leak #Frontend

2026년 4월 1일

[Open WebUI] DOMParser 대신 html-entities로 HTML 디코딩 최적화

스트리밍 중 매 프레임마다 DOM 문서를 생성하던 unescapeHtml을 경량 decode 함수로 교체.

#Open WebUI #TypeScript #Performance #Frontend #GC Pressure

2026년 4월 1일

[Open WebUI] 비중국어 콘텐츠에 대한 불필요한 처리 스킵으로 스트리밍 성능 개선

매 스트리밍 프레임마다 중국어 여부와 관계없이 실행되던 processChineseContent 함수에 가드 조건을 추가하여 비중국어 콘텐츠의 처리 오버헤드를 제거한 PR을 분석합니다.

#Open WebUI #Performance #TypeScript #Streaming #Early Return

2026년 4월 1일

[Loki] 캐시 최대 크기 초과 시 조기 중단으로 OOM 방지

증분 인코딩과 크기 체크로 대용량 응답의 불필요한 버퍼링 제거

#Grafana Loki #Cache #Memory Optimization #Performance

2026년 4월 1일

[Grafana Loki] Bitmap.Slice에서 바이트 정렬 경계의 off-by-one 패닉 수정

endWord 계산에서 8의 배수일 때 1바이트를 초과 할당하여 발생하는 out-of-bounds 패닉을 올림 나눗셈으로 수정한 버그 분석.

#Grafana Loki #Go #Bug Fix #Bitmap #Memory

2026년 4월 1일

[Open WebUI] 채팅 제목 업데이트 시 DB 컨텍스트를 단일 세션으로 통합하여 역직렬화 2회 제거

get_chat_by_id + update_chat_by_id 체이닝으로 두 번의 DB 컨텍스트와 JSON 역직렬화를 발생시키던 로직을 단일 세션으로 인라인한 최적화 분석.

#Open WebUI #Python #Performance #SQLAlchemy #Database

2026년 4월 1일

[sglang] Multi-GPU VLM 서빙에서 ShmPointerMMData broadcast race condition 수정

Multi-GPU VLM 서빙 시 shared memory 세그먼트의 broadcast race condition을 barrier로 해결

#SGLang #VLM #Multi-GPU #Race Condition #Bug Fix

2026년 4월 1일

[sglang] TRT-LLM Sparse MLA 커널의 prefill 배치 지원

TRT-LLM sparse MLA 커널이 prefill 배치에서 올바른 page table 변환을 사용하도록 수정하여 정확도 개선

#SGLang #TRT-LLM #MLA #DeepSeek #Attention

2026년 4월 1일

[sglang] HiRadixCache에서 TTL 기반 hard pin 기능 제거

HiRadixCache의 TTL 기반 prefix pinning 기능 전체를 revert하여 코드 복잡도를 줄이고 캐시 관리를 단순화

#SGLang #Cache #HiRadixCache #Revert

2026년 4월 1일

[sglang] Ascend NPU에서 Ring-SP 성능 벤치마크 페이지 추가

Ascend NPU 플랫폼에서 Ring Sequence Parallelism의 성능 벤치마크 결과를 문서화한 페이지 추가

#SGLang #NPU #Ascend #Ring-SP #Benchmark

2026년 4월 1일