[논문리뷰] Rewiring Experts on the Fly:Continuous Rerouting for Better Online Adaptation in Mixture-of-Expert modelsMoE(Mixture-of-Experts) 모델이 배포 시 발생하는 분포 변화(distribution shifts) 로 인해 차선적인 라우팅 결정(suboptimal routing decisions) 을 겪는 문제를 해결하는 것이 목표입니다.#Review#Mixture-of-Experts (MoE)#Online Adaptation#Test-Time Adaptation (TTA)#Expert Routing#Large Language Models (LLMs)#Self-Supervision#Computational Efficiency#Context Shift Robustness2025년 10월 20일댓글 수 로딩 중
[논문리뷰] Paper2Web: Let's Make Your Paper Alive!이 논문은 학술 논문을 레이아웃 인식적이고 상호작용적이며 멀티미디어 가 풍부한 웹 페이지로 변환하는 PAPER2WEB 이라는 새로운 태스크를 제안합니다.#Review#Academic Webpage Generation#Multi-Agent Systems#Large Language Models#Model Context Protocol#Interactive Content#Multimedia Dissemination#Evaluation Benchmark#Human-Computer Interaction2025년 10월 20일댓글 수 로딩 중
[논문리뷰] OmniVinci: Enhancing Architecture and Data for Omni-Modal Understanding LLM본 연구는 인간처럼 여러 모달리티에 걸쳐 세상을 인지하고 추론할 수 있는 강력한 오픈소스 옴니모달 LLM(Omni-Modal LLM) 인 OmniVinci 를 구축하는 것을 목표로 합니다.#Review#Omni-Modal LLM#Multimodal Understanding#Vision-Audio Alignment#Temporal Reasoning#Data Curation#Foundation Models#Contrastive Learning#Rotary Time Embedding2025년 10월 20일댓글 수 로딩 중
[논문리뷰] NANO3D: A Training-Free Approach for Efficient 3D Editing Without Masks본 논문은 기존 3D 객체 편집 방법들이 비효율적이고 일관성이 부족하며, 편집되지 않은 영역을 보존하는 데 실패하는 문제를 해결하고자 합니다.#Review#3D Object Editing#Training-Free#FlowEdit#Mask-Free#Deep Generative Models#TRELLIS#Data Generation#Geometric Consistency2025년 10월 20일댓글 수 로딩 중
[논문리뷰] MorphoBench: A Benchmark with Difficulty Adaptive to Model Reasoning기존 대규모 모델 평가 벤치마크의 제한된 범위와 난이도 적응성 부족 문제를 해결하는 것이 목표입니다. 모델의 추론 능력에 따라 난이도를 조정하고 업데이트할 수 있는 다학제적 질문을 포함하는 새로운 벤치마크 MORPHOBENCH 를 제안하여 모델의 추론 능력 평가의 포괄성과 유효성을 향상하고자 합니다.#Review#LLM Evaluation#Reasoning Benchmark#Difficulty Adaptation#Multimodal AI#Proof Graph#Agent Recognition#Automated Question Generation2025년 10월 20일댓글 수 로딩 중
[논문리뷰] LightsOut: Diffusion-based Outpainting for Enhanced Lens Flare Removal본 연구는 불완전하거나 프레임 외부의 광원이 존재할 때 기존 단일 이미지 플레어 제거(SIFR) 모델 의 성능이 저하되는 문제를 해결하고자 합니다. 완전한 광원 정보를 재구성함으로써 SIFR 모델의 성능을 크게 향상시키고 시각적 사실성을 높이는 것을 목표로 합니다.#Review#Lens Flare Removal#Diffusion Models#Image Outpainting#Deep Learning#Image Restoration#Preprocessing#LoRA2025년 10월 20일댓글 수 로딩 중
[논문리뷰] Latent Diffusion Model without Variational Autoencoder기존 잠재 확산 모델(LDM)이 VAE(Variational Autoencoder) 의 한계로 인해 훈련 비효율성, 느린 추론 속도, 낮은 전이 학습 능력을 보이는 문제를 해결하고자 합니다.#Review#Latent Diffusion Model#Variational Autoencoder#Self-supervised Learning#DINO Features#Generative Models#Image Generation#Training Efficiency#Unified Representation2025년 10월 20일댓글 수 로딩 중
[논문리뷰] Language Models Model Language전통적인 언어학적 비판(예: Chomsky, de Saussure)에 맞서 LLM이 언어를 모델링하는 능력을 재평가하고, Witold Mańczak의 경험주의적 원칙에 기반한 대안적인 이론적 프레임워크를 제시하는 것을 목표로 합니다. 이를 통해 LLM의 설계, 평가 및 해석을 위한 건설적인 가이드를 제공하고자 합니다.#Review#Large Language Models#Linguistics#Witold Mańczak#Frequency Hypothesis#Empirical Validation#Usage-Based Linguistics#Semantic Embeddings2025년 10월 20일댓글 수 로딩 중
[논문리뷰] InfiMed-ORBIT: Aligning LLMs on Open-Ended Complex Tasks via Rubric-Based Incremental Training본 논문은 보상 함수가 모호하고 주관적인 개방형 AI 태스크 , 특히 의료 상담 과 같은 고위험 시나리오에서 LLM의 성능 향상을 목표로 합니다.#Review#LLMs#Reinforcement Learning#Rubric-Based Training#Medical Dialogue#Open-Ended Tasks#HealthBench#RAG2025년 10월 20일댓글 수 로딩 중
[논문리뷰] Imaginarium: Vision-guided High-Quality 3D Scene Layout Generation본 논문은 기존의 수동 최적화 방법론, 심층 생성 모델, 대규모 언어 모델(LLM) 기반 접근법의 한계(예: 복잡한 공간 관계 처리의 어려움, 다양성 부족, 낮은 품질)를 극복하여, 시각적으로 일관되고 심미적으로 매력적인 고품질 3D 장면 레이아웃을 생성 하는 시스템을 개발하는 것을 목표로 합니다.#Review#3D Scene Layout Generation#Vision-guided#Diffusion Models#Scene Graph#Asset Retrieval#Pose Estimation#High-Quality Assets#AI Content Creation2025년 10월 20일댓글 수 로딩 중
[논문리뷰] Foundation Models for Scientific Discovery: From Paradigm Enhancement to Paradigm Transition본 논문은 GPT-4 및 AlphaFold와 같은 파운데이션 모델(FMs) 이 과학 연구의 기존 방법론을 단순히 개선하는 것을 넘어, 새로운 과학 패러다임으로의 전환을 촉진하고 있다는 주장을 제시합니다.#Review#Foundation Models#Scientific Discovery#Paradigm Shift#Human-AI Collaboration#Autonomous Agents#Meta-Science#Experimental Design#Hypothesis Generation2025년 10월 20일댓글 수 로딩 중
[논문리뷰] FinTrust: A Comprehensive Benchmark of Trustworthiness Evaluation in Finance Domain본 논문은 금융 도메인에서 대규모 언어 모델(LLM)의 신뢰성을 종합적으로 평가하기 위한 FINTRUST 벤치마크를 제시합니다.#Review#LLM Trustworthiness#Finance Domain#Benchmark#Alignment Evaluation#Financial AI#Hallucination#Privacy#Fairness2025년 10월 20일댓글 수 로딩 중
[논문리뷰] Explore to Evolve: Scaling Evolved Aggregation Logic via Proactive Online Exploration for Deep Research Agents기존 웹 에이전트 시스템들이 정보 탐색 기능에만 중점을 두고 정보 집계 능력을 간과하여 심층적인 연구 결과 생성을 제한하는 문제를 해결하고자 합니다.#Review#Web Agents#Information Aggregation#Data Synthesis#Online Exploration#Foundation Models#Multi-hop QA#Deep Research2025년 10월 20일댓글 수 로딩 중
[논문리뷰] Emergent Misalignment via In-Context Learning: Narrow in-context examples can produce broadly misaligned LLMs본 논문은 기존 파인튜닝(fine-tuning) 및 활성화 조종(activation steering)에서 관찰된 ' emergent misalignment (EM)' 현상이 인컨텍스트 학습(In-Context Learning, ICL) 환경에서도 발생하는지 여부를 탐구합니다.#Review#Emergent Misalignment#In-Context Learning#LLM Safety#Persona Rationalization#Prompt Engineering#Model Alignment2025년 10월 20일댓글 수 로딩 중
[논문리뷰] ERGO: Entropy-guided Resetting for Generation Optimization in Multi-turn Language Models논문은 다중 턴 대화에서 Large Language Models (LLMs) 의 성능이 저하되는 문제를 해결하는 것을 목표로 합니다. 특히, 정보가 점진적으로 주어질 때 LLM이 대화 맥락을 '잃어버려' 발생하는 정확도 감소 및 신뢰성 하락을 개선하고자 합니다.#Review#Multi-turn Conversation#Large Language Models (LLMs)#Context Management#Entropy-guided Resetting#Uncertainty Quantification#Performance Degradation#Prompt Engineering#Conversational AI2025년 10월 20일댓글 수 로딩 중
[논문리뷰] DriveGen3D: Boosting Feed-Forward Driving Scene Generation with Efficient Video Diffusion본 논문은 기존 방법론의 한계인 긴 시간 동안의 비디오 생성에 대한 과도한 계산 요구, 3D 표현 없는 장기 비디오 합성 집중, 또는 정적 단일 장면 재구성에 대한 제약을 해결합니다.#Review#Driving Scene Generation#Video Diffusion#3D Reconstruction#Gaussian Splatting#Feed-Forward Models#Temporal Coherence#Multimodal Control2025년 10월 20일댓글 수 로딩 중
[논문리뷰] DLER: Doing Length pEnalty Right - Incentivizing More Intelligence per Token via Reinforcement Learning본 논문은 추론 언어 모델(LLM)이 불필요하게 긴 출력을 생성하는 문제를 해결하고, 토큰당 인텔리전스(정확도 대비 응답 길이)를 극대화하는 것을 목표로 합니다. 특히, 길이 패널티로 인한 정확도 저하가 패널티 설계 자체보다는 RL 최적화 기법 의 미흡함에서 비롯됨을 재조명하여 이를 개선하고자 합니다.#Review#Reinforcement Learning#Length Penalty#Reasoning Efficiency#Large Language Models#RL Optimization#Accuracy-Efficiency Trade-off#Chain-of-Thought2025년 10월 20일댓글 수 로딩 중
[논문리뷰] Build Your Personalized Research Group: A Multiagent Framework for Continual and Interactive Science Automation과학 자동화를 위한 기존 에이전트 시스템의 고정된 워크플로우 와 불충분한 컨텍스트 관리 라는 한계를 극복하는 것입니다. 궁극적으로는 동적이고 상호작용적인 다중 에이전트 프레임워크를 통해 지속적인 장기 연구 프로그램 을 자율적으로 수행하고, 아이디어 구상부터 출판까지 종단 간 과학 연구 자동화 를 실현하고자 합니다.#Review#Multiagent Systems#Science Automation#Dynamic Workflows#Workspace-based Communication#Context Compaction#Human-in-the-loop AI#Open-source Framework2025년 10월 20일댓글 수 로딩 중
[논문리뷰] BLIP3o-NEXT: Next Frontier of Native Image Generation본 논문은 BLIP3o-NEXT 라는 오픈소스 기반 모델을 제안하여 차세대 이미지 생성의 발전을 목표로 합니다. 단일 아키텍처 내에서 텍스트-투-이미지 생성 과 이미지 편집 기능을 통합하고, 강력한 이미지 생성 및 편집 능력을 시연하는 것을 주된 목표로 합니다.#Review#Image Generation#Image Editing#Autoregressive Model#Diffusion Model#Reinforcement Learning#Multimodal AI#Foundation Model#Open-source2025년 10월 20일댓글 수 로딩 중
[논문리뷰] A^2FM: An Adaptive Agent Foundation Model for Tool-Aware Hybrid Reasoning이 논문은 추론 중심 LLM(도구 사용 불가)과 에이전트 중심 LLM(추론 능력 부족) 간의 근본적인 격차를 해결하고자 합니다.#Review#Adaptive Agent#Foundation Model#Hybrid Reasoning#Tool-Aware LLM#Mode Selection#Reinforcement Learning#Cost Efficiency#LLM Agent2025년 10월 20일댓글 수 로딩 중