#Edge Computing

4개의 포스트

[논문리뷰] ShadowPEFT: Shadow Network for Parameter-Efficient Fine-Tuning

본 논문은 기존 LoRA 스타일의 PEFT 방식이 가진 파편화된 적응(fragmented adaptation) 구조를 극복하기 위해 ShadowPEFT를 제안한다.

#Review #Parameter-Efficient Fine-Tuning #Shadow Network #Large Language Models #Modular Deployment #Edge Computing

2026년 4월 21일

[논문리뷰] Efficient Reasoning on the Edge

Large Language Models (LLMs)는 Chain-of-Thought (CoT) Reasoning을 통해 복잡한 문제 해결에서 최첨단 성능을 달성하지만, Edge Device 배포에는 여러 제약이 따릅니다.

#Review #LLMs #Edge Computing #LoRA #Quantization #Budget Forcing #Switcher Module #Parallel Reasoning

2026년 3월 17일

[논문리뷰] Mobile-O: Unified Multimodal Understanding and Generation on Mobile Device

본 논문은 기존의 멀티모달 모델들이 데이터 학습량 이 많고 배포에 필요한 리소스 가 커서 엣지 디바이스에 적용하기 어렵다는 문제점을 해결하고자 합니다. 통합된 멀티모달 아키텍처 를 통해 시각적 이해와 생성을 동시에 수행하면서, 모바일 기기에서 실시간 추론 이 가능하도록 효율적인 모델 을 구축하는 것을 목표로 합니다.

#Review #Multimodal AI #Vision-Language Models #Diffusion Models #Mobile Devices #Edge Computing #Model Efficiency #Unified Architecture #Real-time Inference

2026년 2월 23일

[논문리뷰] Intelligence per Watt: Measuring Intelligence Efficiency of Local AI

본 논문은 급증하는 LLM 추론 수요로 인해 중앙 집중식 클라우드 인프라가 겪는 부담을 완화하기 위해 로컬 AI의 실행 가능성을 정량화하는 것을 목표로 합니다.

#Review #Local AI #LLM Inference #Intelligence per Watt #Edge Computing #Hybrid Cloud #AI Efficiency #Hardware Benchmarking #Query Routing

2025년 11월 11일