최신 포스트

[pydantic-ai] DBOS 테스트용 인메모리 SQLite 되돌리기: 파일 기반 DB 복원

인메모리 SQLite로 전환했던 DBOS 테스트를 파일 기반으로 되돌리고, 자동 정리 fixture를 추가한 사례를 분석합니다.

#pydantic-ai #DBOS #SQLite #Testing #Revert

2026년 1월 6일

[논문리뷰] VINO: A Unified Visual Generator with Interleaved OmniModal Context

본 논문은 파편화된 기존 시각 생성 파이프라인의 한계를 극복하고, 단일 프레임워크 내에서 이미지 및 비디오 생성과 편집을 모두 수행할 수 있는 통합 시각 생성기 VINO 를 개발하는 것을 목표로 합니다.

#Review #Unified Generation #Multimodal Diffusion #Vision-Language Model #Image Editing #Video Editing #Interleaved Context #Progressive Training #Diffusion Transformer

2026년 1월 5일

[논문리뷰] VAR RL Done Right: Tackling Asynchronous Policy Conflicts in Visual Autoregressive Generation

Visual Autoregressive (VAR) 모델은 이질적인 입력 구조와 생성 단계별로 크게 변동하는 쿼리 토큰 수로 인해 비동기 정책 충돌이 발생하여, 특히 RL 환경에서 불안정한 학습과 최적화되지 않은 정렬을 초래합니다.

#Review #Visual Autoregressive Models #Reinforcement Learning #Policy Conflicts #GRPO #Text-to-Image Generation #Credit Assignment #Multi-scale Generation

2026년 1월 5일

[논문리뷰] Toward Stable Semi-Supervised Remote Sensing Segmentation via Co-Guidance and Co-Fusion

본 논문은 원격 탐사(RS) 이미지의 시맨틱 분할에서 의사 레이블(pseudo-label) 드리프트 와 확증 편향 으로 인한 오류 축적 문제를 해결하고, 고비용의 픽셀 단위 주석 의존도를 낮추는 것을 목표로 합니다.

#Review #Semi-Supervised Learning #Semantic Segmentation #Remote Sensing #Vision Foundation Models #Pseudo-Label Drift #Co-Guidance #Feature Fusion

2026년 1월 5일

[논문리뷰] Talk2Move: Reinforcement Learning for Text-Instructed Object-Level Geometric Transformation in Scenes

본 논문은 기존 텍스트 기반 이미지 편집 모델이 객체 수준의 기하학적 변환(이동, 회전, 크기 조절)에 어려움을 겪는 문제를 해결하고자 합니다.

#Review #Reinforcement Learning #Text-Guided Image Editing #Object-Level Transformation #Geometric Transformation #Diffusion Models #GRPO #Scene Editing #Spatially Grounded Rewards

2026년 1월 5일

[논문리뷰] SWE-Lego: Pushing the Limits of Supervised Fine-tuning for Software Issue Resolving

본 논문은 소프트웨어 엔지니어링(SWE) 문제 해결 분야에서 SFT (Supervised Fine-tuning) 전용 경량 접근 방식 의 한계를 확장하여 최첨단 성능을 달성하는 것을 목표로 합니다. 복잡한 훈련 패러다임(예: 중간 훈련, 강화 학습) 없이도 SFT만으로 높은 성능을 낼 수 있음을 보여주고자 합니다.

#Review #Software Engineering #Issue Resolution #Supervised Fine-tuning (SFT)#Large Language Models (LLMs)#Hybrid Dataset #Error Masking #Curriculum Learning #Test-Time Scaling (TTS)#Generative Verifiers

2026년 1월 5일

[논문리뷰] Recursive Language Models

본 논문은 대규모 언어 모델(LLMs)이 컨텍스트 길이 제한으로 인해 긴 프롬프트를 효과적으로 처리하지 못하고 '컨텍스트 로트(context rot)' 현상을 겪는 문제를 해결하고자 합니다. 특히, 수백만 토큰 규모의 장기 작업에서 일반 목적 LLM의 컨텍스트 크기를 추론 시점에 획기적으로 확장 하는 것을 목표로 합니다.

#Review #Recursive Language Models #Large Language Models #Long Context Processing #Inference Scaling #REPL Environment #Task Decomposition #Sub-LM Calls #Context Management

2026년 1월 5일

[논문리뷰] Project Ariadne: A Structural Causal Framework for Auditing Faithfulness in LLM Agents

본 논문은 대규모 언어 모델(LLM) 에이전트의 Chain-of-Thought(CoT) 추론 과정 이 실제 모델 출력의 원인인지 혹은 사후 합리화인지에 대한 'Faithfulness Gap' 문제를 해결하고자 합니다.

#Review #LLM Agents #Faithfulness #XAI #Causal Inference #Structural Causal Models #Counterfactual Interventions #Reasoning Trace Auditing #Causal Decoupling

2026년 1월 5일

[논문리뷰] OpenNovelty: An LLM-powered Agentic System for Verifiable Scholarly Novelty Assessment

OpenNovelty 는 방대하고 빠르게 진화하는 학술 문헌 속에서 논문의 독창성을 평가하는 피어 리뷰의 어려움을 해결하고자 합니다. 특히, 기존 LLM 기반 접근법 이 겪는 환각 현상이나 세부 분석 부족 문제를 극복하여, 투명하고 추적 가능하며 증거에 기반한 독창성 분석을 제공하는 것을 목표로 합니다.

#Review #LLM 에이전트 시스템 #학술 독창성 평가 #피어 리뷰 지원 #증거 기반 검증 #의미론적 검색 #계층적 분류 체계 #대규모 언어 모델

2026년 1월 5일

[논문리뷰] NextFlow: Unified Sequential Modeling Activates Multimodal Understanding and Generation

NextFlow는 단일 decoder-only autoregressive transformer 를 사용하여 멀티모달 이해 및 생성 능력을 통합하는 것을 목표로 합니다.

#Review #Multimodal AI #Decoder-only Transformer #Next-scale Prediction #Image Generation #Image Editing #Reinforcement Learning #Unified Modeling #TokenFlow

2026년 1월 5일

[논문리뷰] M-ErasureBench: A Comprehensive Multimodal Evaluation Benchmark for Concept Erasure in Diffusion Models

본 논문은 텍스트-투-이미지 확산 모델의 개념 삭제(concept erasure) 방법들이 텍스트 프롬프트 외의 다른 입력 양식(모달리티)에 대해 얼마나 취약한지 평가하고, 이러한 취약점을 개선할 수 있는 새로운 추론 시간 방어 메커니즘을 제안하는 것을 목표로 합니다.

#Review #Diffusion Models #Concept Erasure #Multimodal Evaluation #Adversarial Attacks #Robustness #Textual Inversion #Latent Inversion #Cross-Attention

2026년 1월 5일

[논문리뷰] KV-Embedding: Training-free Text Embedding via Internal KV Re-routing in Decoder-only LLMs

디코더 전용 LLM을 학습 없이 텍스트 임베딩 백본으로 활용할 때 발생하는 두 가지 구조적 문제(인과적 어텐션으로 인한 정보 비대칭, 다음 토큰 예측 목표로 인한 의미 압축 편향)를 해결하여, 고품질의 텍스트 임베딩을 효율적으로 추출하는 것입니다.

#Review #Text Embedding #Decoder-only LLMs #Training-free #KV Re-routing #Causal Attention #Representation Learning #Intrinsic Dimensionality

2026년 1월 5일

[논문리뷰] K-EXAONE Technical Report

LG AI Research는 K-EXAONE 이라는 대규모 다국어 언어 모델을 개발하여 최첨단 성능을 달성하는 것을 목표로 합니다. 특히, 기존 모델의 한계를 극복하고 한국의 AI 인프라 환경을 고려하여 효율적이면서도 강력한 범용 및 전문 AI 기반 모델을 제공하고자 합니다.

#Review #Multilingual Language Model #Mixture-of-Experts (MoE)#Long Context #AI Safety #Korean AI #Foundation Model #Reinforcement Learning (RL)

2026년 1월 5일

[논문리뷰] InfiniteVGGT: Visual Geometry Grounded Transformer for Endless Streams

본 논문은 실시간 스트리밍 환경에서 3D 시각 기하학 이해 가 확장성과 장기적 안정성이라는 상충되는 요구사항으로 인해 제한되는 문제를 해결하고자 합니다.

#Review #3D Reconstruction #Transformer #Streaming Perception #Memory Management #KV Cache Pruning #Visual Geometry #Temporal Consistency #Continuous Learning

2026년 1월 5일

[논문리뷰] IMA++: ISIC Archive Multi-Annotator Dermoscopic Skin Lesion Segmentation Dataset

이 연구는 피부 병변 분할(Skin Lesion Segmentation, SLS) 분야의 주요 난제 중 하나인 대규모 다중-어노테이터(multi-annotator) 데이터셋의 부족 문제를 해결하는 것을 목표로 합니다.

#Review #Dermoscopy #Skin Lesion Segmentation #Multi-Annotator Dataset #Inter-Annotator Variability #ISIC Archive #Medical Image Analysis #Machine Learning #Data Annotation

2026년 1월 5일

[논문리뷰] GARDO: Reinforcing Diffusion Models without Reward Hacking

Reinforcement Learning(RL) 기반의 확산 모델 fine-tuning 과정에서 발생하는 Reward Hacking 문제(proxy reward는 증가하지만 실제 이미지 품질이 저하되고 다양성이 감소하는 현상)를 해결하는 것이 주 목표입니다.

#Review #Diffusion Models #Reinforcement Learning #Reward Hacking #KL Regularization #Adaptive Regularization #Diversity Optimization #Text-to-Image Generation

2026년 1월 5일

[논문리뷰] Falcon-H1R: Pushing the Reasoning Frontiers with a Hybrid Model for Efficient Test-Time Scaling

본 연구는 7B 파라미터의 소규모 언어 모델(SLM)인 Falcon-H1R 이 대규모 모델(2배에서 7배 더 큼)과 경쟁하거나 능가하는 추론 성능을 달성할 수 있음을 입증하는 것을 목표로 합니다.

#Review #Reasoning #Small Language Models (SLMs)#Hybrid Architecture #Test-Time Scaling (TTS)#Supervised Fine-Tuning (SFT)#Reinforcement Learning (RL)#DeepConf #Computational Efficiency

2026년 1월 5일

[논문리뷰] DreamID-V:Bridging the Image-to-Video Gap for High-Fidelity Face Swapping via Diffusion Transformer

비디오 얼굴 스와핑(VFS)에서 기존 이미지 얼굴 스와핑(IFS) 모델 대비 신원 유사성 및 속성 보존 능력의 격차를 해소하고, 시간적 일관성 문제를 해결하는 것이 주된 목표입니다.

#Review #Video Face Swapping #Diffusion Transformer #Identity Preservation #Temporal Consistency #Modality-Aware Conditioning #Reinforcement Learning #Data Synthesis

2026년 1월 5일

[논문리뷰] Can LLMs Predict Their Own Failures? Self-Awareness via Internal Circuits

거대 언어 모델(LLM)이 생성하는 텍스트의 정확성 또는 오류를 스스로 인지하지 못하는 문제를 해결하고, 외부 평가자 없이 LLM 내부 작동을 통해 자체 실패를 예측할 수 있는 경량 메커니즘 을 개발하는 것을 목표로 합니다. 이는 LLM의 신뢰성, 안전성 및 효율성을 향상시키는 데 중요합니다.

#Review #LLM Self-Awareness #Failure Prediction #Internal States #Attention Mechanisms #Neural Network Probes #Computational Efficiency #Zero-Shot Transfer

2026년 1월 5일

[논문리뷰] COMPASS: A Framework for Evaluating Organization-Specific Policy Alignment in LLMs

본 논문은 범용적인 유해성 평가를 넘어, LLM이 기업 및 조직 특유의 허용 목록(allowlist) 및 거부 목록(denylist) 정책 을 얼마나 잘 준수하는지 체계적으로 평가하기 위한 COMPASS 프레임워크를 제안합니다.

#Review #LLM Evaluation #Policy Alignment #Organizational Policies #AI Safety #Adversarial Robustness #Refusal Behavior #Prompt Engineering #Fine-tuning

2026년 1월 5일