최신 포스트

[논문리뷰] Adaptive Text Anonymization: Learning Privacy-Utility Trade-offs via Prompt Optimization

본 논문은 기존 텍스트 익명화 방법론들이 수동적이고 정적이며 다양한 도메인과 프라이버시-유틸리티 요구사항에 유연하게 대응하지 못하는 한계를 해결하고자 합니다. 이를 위해 익명화 전략을 특정 프라이버시-유틸리티 요구사항에 맞춰 자동으로 조정하는 적응형 텍스트 익명화 라는 새로운 태스크를 제안합니다.

#Review #Text Anonymization #Large Language Models #Prompt Optimization #Privacy-Utility Trade-offs #Evolutionary Algorithms #Multi-objective Optimization #Data Privacy

2026년 2월 24일

[Ray] 다중 gRPC 연결로 오브젝트 전송 처리량 향상

GRPC_ARG_USE_LOCAL_SUBCHANNEL_POOL 옵션으로 오브젝트 매니저의 gRPC 연결을 다중화하여 전송 대역폭을 확대한 분석.

#Ray #C++#Performance #gRPC #Networking

2026년 2월 24일

[Loki] 쿼리 엔진 정합성 테스트 병렬 실행으로 CI 시간 15% 단축

Grafana Loki의 구/신 쿼리 엔진 정합성 테스트에서 순차 실행되던 두 엔진 쿼리를 errgroup을 활용해 병렬로 실행하여 전체 테스트 시간을 15% 줄인 최적화를 분석합니다.

#Grafana Loki #Go #Testing #Performance #Parallelism #errgroup

2026년 2월 24일

[Ray] 다중 입력 연산자의 메모리 귀속 오류 수정으로 데드락 해결

Ray Data의 UnionOp/ZipOp에서 전체 내부 큐 크기를 각 업스트림에 동일하게 귀속시켜 발생하던 잘못된 백프레셔와 데드락을, 입력별 큐 추적으로 해결한 버그 수정을 분석합니다.

#Ray #Python #Performance #Deadlock #Memory Management #Data Pipeline

2026년 2월 24일

[Triton] AsyncCompileMode 에러 발생 시 active_mode 초기화 보장

context manager exit에서 예외 발생 시에도 active_mode를 None으로 설정하여 후속 컴파일 블록킹 방지

#Triton #Python #Bug Fix #Error Handling #Async Compilation

2026년 2월 24일

[Grafana Loki] 오브젝트 스토어 클라이언트에 요청 레이턴시 히스토그램 메트릭 추가

기존 Thanos 클라이언트의 e2e 메트릭과 별개로, 요청 헤징 후 실제 라운드트립 레이턴시를 측정하는 네이티브 히스토그램 메트릭을 추가한 분석.

#Grafana Loki #Go #Performance #Observability #Prometheus

2026년 2월 24일

[faster-qwen3-tts] nano-parakeet으로 참조 오디오 자동 전사 기능 추가

데모 UI에서 참조 오디오 업로드 시 nano-parakeet ASR 모델로 텍스트를 자동 전사하여 UX를 개선한다

#faster-qwen3-tts #TTS #ASR #Demo

2026년 2월 24일

[Gradio] 서브탭/아코디언 컴포넌트 Lazy Loading 도입

비활성 탭과 닫힌 아코디언의 자식 컴포넌트를 지연 렌더링하여 초기 로드 성능을 개선한다

#Gradio #Lazy Loading #Frontend Performance #Svelte

2026년 2월 24일

[pytorch] MPS: 2-pass SDPA의 메모리 손상을 float accumulator 강제로 수정

Apple MPS 백엔드의 2-pass Scaled Dot-Product Attention에서 half precision accumulator로 인한 메모리 손상 버그를 float32 강제 전환으로 해결한 사례를 분석합니다.

#PyTorch #MPS #SDPA #Attention #Precision #Apple Silicon #Bug Fix

2026년 2월 24일

[Grafana Loki] 쿼리 엔진 aggregator의 자료구조를 개선하여 38% 성능 향상

groupState에서 라벨 데이터를 분리하고, 라벨 목록을 맵으로 변경하며, BuildRecord의 선형 탐색을 제거하여 메트릭 쿼리 실행 시간을 38% 단축한 분석.

#Grafana Loki #Go #Performance #Query Engine #Data Structure #Aggregation

2026년 2월 24일

[논문리뷰] tttLRM: Test-Time Training for Long Context and Autoregressive 3D Reconstruction

본 논문은 기존 3D 재구성 모델들이 가지는 느린 최적화 , 제한적인 입력 뷰 확장성 , 그리고 긴 시퀀스 컨텍스트 처리 능력 의 한계를 극복하는 것을 목표로 합니다.

#Review #3D Reconstruction #Test-Time Training (TTT)#Autoregressive Modeling #Long-Context #Gaussian Splatting #Neural Radiance Fields #Large Reconstruction Models

2026년 2월 23일

[논문리뷰] VLANeXt: Recipes for Building Strong VLA Models

파편화되어 있는 Vision-Language-Action (VLA) 모델 연구 분야에 구조를 제공하고, 일관된 프레임워크와 평가 환경에서 VLA 모델의 설계 공간을 체계적으로 재검토하는 것을 목표로 합니다.

#Review #Vision-Language-Action Models #Robotics #Imitation Learning #Foundation Models #Ablation Study #Generalization #LIBERO Benchmark #Time-Series Forecasting

2026년 2월 23일

[논문리뷰] TOPReward: Token Probabilities as Hidden Zero-Shot Rewards for Robotics

본 논문은 로봇 공학 분야의 주요 병목 현상인 보상 모델링 문제를 해결하기 위해, 사전 훈련된 Vision-Language Models (VLMs) 의 내부 토큰 확률 을 활용하여 제로-샷(zero-shot) 진척도(progress) 추정 을 가능하게 하는 것을 목표로 합니다.

#Review #Robotics #Reward Modeling #Vision-Language Models #Zero-Shot Learning #Token Probabilities #Progress Estimation #Behavior Cloning #Manipulation

2026년 2월 23일

[논문리뷰] SkillOrchestra: Learning to Route Agents via Skill Transfer

논문은 복합 AI 시스템에서 효과적인 오케스트레이션 문제를 해결하고자 합니다.

#Review #Agent Orchestration #Skill Transfer #LLM Routing #Performance-Cost Trade-off #Routing Collapse #Multi-turn Dialogue #Skill Handbook #Reinforcement Learning

2026년 2월 23일

[논문리뷰] SimVLA: A Simple VLA Baseline for Robotic Manipulation

본 논문은 급변하는 VLA 연구 분야에서 성능 향상의 정확한 원인을 파악하기 어려운 문제를 해결하기 위해, 간소화된 VLA 베이스라인 SimVLA 를 제안합니다.

#Review #Robotic Manipulation #Vision-Language-Action (VLA) Models #Baseline Model #Modular Design #Flow Matching #Zero-Shot Generalization #Standardized Training #Efficiency

2026년 2월 23일

[논문리뷰] SenTSR-Bench: Thinking with Injected Knowledge for Time-Series Reasoning

본 연구는 시계열 데이터에 대한 진단 추론에서 발생하는 문제를 해결하는 것을 목표로 합니다. 일반 추론 거대 언어 모델(GRLMs)의 강력한 추론 능력과 시계열 전문 LLM(TSLMs)의 도메인 특화 지식 간의 격차를 해소하여, 복잡한 시계열 패턴에 대한 강력하고 문맥 인식적인 진단 통찰력을 제공하고자 합니다.

#Review #Time-Series Reasoning #Knowledge Injection #Large Language Models (LLMs)#Reinforcement Learning (RL)#Diagnostic AI #Multimodal AI #SenTSR-Bench

2026년 2월 23일

[논문리뷰] RoboCurate: Harnessing Diversity with Action-Verified Neural Trajectory for Robot Learning

로봇 학습을 위한 비디오 생성 모델 기반 합성 데이터는 액션 품질의 일관성 부족과 물리적 정확성 검증의 어려움으로 인해 제한적인 성능을 보입니다.

#Review #Robot Learning #Synthetic Data Generation #Action Verification #Neural Trajectory #Video Generative Models #Imitation Learning #Data Diversity

2026년 2월 23일

[논문리뷰] Nacrith: Neural Lossless Compression via Ensemble Context Modeling and High-Precision CDF Coding

본 논문은 135M 파라미터 트랜스포머 언어 모델 (SmolLM2-135M) 과 경량 온라인 예측기 앙상블을 활용하여 자연어 텍스트에 대한 손실 없는 압축 성능을 극대화하는 것을 목표로 합니다.

#Review #Lossless Compression #Neural Compression #Language Models #Arithmetic Coding #Context Mixing #Ensemble Prediction #CDF Quantization #GPU Acceleration

2026년 2월 23일

[논문리뷰] Mobile-O: Unified Multimodal Understanding and Generation on Mobile Device

본 논문은 기존의 멀티모달 모델들이 데이터 학습량 이 많고 배포에 필요한 리소스 가 커서 엣지 디바이스에 적용하기 어렵다는 문제점을 해결하고자 합니다. 통합된 멀티모달 아키텍처 를 통해 시각적 이해와 생성을 동시에 수행하면서, 모바일 기기에서 실시간 추론 이 가능하도록 효율적인 모델 을 구축하는 것을 목표로 합니다.

#Review #Multimodal AI #Vision-Language Models #Diffusion Models #Mobile Devices #Edge Computing #Model Efficiency #Unified Architecture #Real-time Inference

2026년 2월 23일

[논문리뷰] ManCAR: Manifold-Constrained Latent Reasoning with Adaptive Test-Time Computation for Sequential Recommendation

순차 추천 시스템에서 기존 잠재 다단계 추론(latent multi-step reasoning) 방식이 중간 추론 상태의 제약 부족으로 인해 발생하던 잠재 드리프트(latent drift) 문제를 해결하고자 합니다.

#Review #Sequential Recommendation #Latent Reasoning #Manifold Constraint #Adaptive Computation #Graph Neural Networks #Variational Inference #Teacher Scheduling #Drift Prevention

2026년 2월 23일