Review

[논문리뷰] Judging with Confidence: Calibrating Autoraters to Preference Distributions

이 논문은 현재 LLM 기반 자동 평가자(autoraters)가 이진 선호 레이블로만 훈련되어 인간 판단의 주관성과 분포적 특성을 간과하고, 불확실성과 소수 의견을 무시하는 근본적인 한계를 해결하고자 합니다.

#Review #Large Language Models #Autoraters #Calibration #Preference Distributions #Reinforcement Learning #Supervised Fine-tuning #Positional Bias

2025년 10월 7일

[논문리뷰] Imperceptible Jailbreaking against Large Language Models

본 논문은 기존의 가시적인 텍스트 수정 방식과 달리 눈에 보이지 않는(imperceptible) 방식으로 LLM의 안전 장치를 우회하는 새로운 제일브레이크 공격 기법을 제안합니다.

#Review #Large Language Models #Jailbreaking #Imperceptible Attacks #Unicode Variation Selectors #Adversarial Suffixes #Safety Alignment #Prompt Injection

2025년 10월 7일

[논문리뷰] Hybrid Architectures for Language Models: Systematic Analysis and Design Insights

기존 대규모 언어 모델(LLM)에서 Transformer 의 quadratic 복잡성과 Mamba 의 장문 컨텍스트 처리 한계를 극복하고자 합니다.

#Review #Hybrid LLM #Transformer Architecture #Mamba #State Space Models (SSM)#Computational Efficiency #Long-Context #Language Model Architectures #Scaling Laws

2025년 10월 7일

[논문리뷰] HiKE: Hierarchical Evaluation Framework for Korean-English Code-Switching Speech Recognition

본 연구는 한국어-영어 코드 스위칭(CS) 음성 인식(ASR) 분야의 심각한 연구 부족을 해결하고, 다국어 ASR 모델의 정밀한 평가를 위한 최초의 공개적인 계층적 평가 프레임워크인 HiKE 를 제시하는 것을 목표로 합니다.

#Review #Code-Switching #Speech Recognition #Korean-English ASR #Evaluation Framework #Multilingual ASR #Loanword Processing #Fine-tuning #Hierarchical Labeling

2025년 10월 7일

[논문리뷰] Graph2Eval: Automatic Multimodal Task Generation for Agents via Knowledge Graphs

본 논문은 정적 데이터셋 기반의 평가가 LLM 기반 에이전트 의 실제 역량(특히 동적 환경 및 다단계 상호작용)을 적절히 측정하지 못하는 문제점을 해결하고자 합니다.

#Review #Agent Evaluation #Task Generation #Knowledge Graphs #Multimodal AI #Web Interaction #Document Comprehension #LLM-driven Agents

2025년 10월 7일

[논문리뷰] Good Intentions Beyond ACL: Who Does NLP for Social Good, and Where?

본 연구는 NLP4SG (NLP for Social Good) 연구의 저자 및 게재지별 분포를 분석하여 그 현황을 파악하는 것을 목표로 합니다.

#Review #NLP for Social Good #ACL Community #Scientometrics #Venue Analysis #Author Classification #Sustainable Development Goals #Neural Methods #Research Landscape

2025년 10월 7일

[논문리뷰] Front-Loading Reasoning: The Synergy between Pretraining and Post-Training Data

본 논문은 대규모 언어 모델(LLM)의 추론 능력을 극대화하기 위해 사전 훈련(pretraining)과 지도 미세 조정(SFT) 단계 간에 추론 데이터를 최적으로 할당하는 방법을 체계적으로 탐구하는 것을 목표로 합니다.

#Review #Large Language Models #Pretraining #Supervised Fine-tuning #Reasoning Data #Data Allocation #Diversity #Quality #Reinforcement Learning

2025년 10월 7일

[논문리뷰] Factuality Matters: When Image Generation and Editing Meet Structured Visuals

본 연구는 최신 시각 생성 모델들이 차트, 다이어그램, 수학 도형과 같은 구조화된 시각 자료 생성 및 편집에서 보이는 한계를 해결하고자 합니다. 이러한 자료들은 구성 계획 , 텍스트 렌더링 , 멀티모달 추론 을 통한 사실적 정확성 을 요구하며, 이 분야에 대한 체계적인 탐구가 부족하다는 문제를 인식했습니다.

#Review #Structured Visuals #Image Generation #Image Editing #Multimodal Reasoning #Factual Fidelity #Chain-of-Thought #Evaluation Benchmark #Diffusion Models

2025년 10월 7일

[논문리뷰] EvolProver: Advancing Automated Theorem Proving by Evolving Formalized Problems via Symmetry and Difficulty

본 논문은 형식적 정리 증명(formal theorem proving) 분야에서 대규모 언어 모델(LLMs) 의 일반화 능력이 부족하고 문제 진술의 사소한 변화에도 취약하다는 한계를 해결하는 것을 목표로 합니다.

#Review #Automated Theorem Proving #Data Augmentation #Large Language Models #Formal Mathematics #Symmetry #Difficulty Evolution #Abstract Syntax Tree #Generalizability

2025년 10월 7일

[논문리뷰] Epistemic Diversity and Knowledge Collapse in Large Language Models

대규모 언어 모델(LLM)이 생성하는 텍스트의 동질성이 지식 붕괴(knowledge collapse)로 이어질 수 있다는 문제에 주목합니다.

#Review #Large Language Models #Epistemic Diversity #Knowledge Collapse #Homogenization #Retrieval-Augmented Generation #LLM Evaluation #Information Diversity #Cultural Bias

2025년 10월 7일

[논문리뷰] Code4MeV2: a Research-oriented Code-completion Platform

AI 기반 코드 완성 도구의 사용자 상호작용 데이터가 독점적으로 관리되는 문제를 해결하여, 연구자들이 재현 가능한 대규모 데이터 분석을 수행할 수 있도록 연구 지향적인 오픈 소스 코드 완성 플랫폼인 Code4Me V2 를 개발하는 것을 목표로 합니다.

#Review #Code Completion #Research Platform #Human-AI Interaction #Software Engineering #Open Science #JetBrains IDE Plugin #Telemetry #AI4SE

2025년 10월 7일

[논문리뷰] ChronoEdit: Towards Temporal Reasoning for Image Editing and World Simulation

본 논문은 기존 이미지 편집 모델의 물리적 일관성 부족 문제를 해결하고, 특히 월드 시뮬레이션 관련 작업에서 편집된 객체가 장면의 맥락과 물리적으로 일관되게 유지되도록 하는 것을 목표로 합니다.

#Review #Image Editing #Video Generation #Temporal Reasoning #World Simulation #Physical Consistency #Diffusion Models #Generative Models

2025년 10월 7일

[논문리뷰] Character Mixing for Video Generation

이 논문은 비디오 생성에서 비공존 캐릭터 간의 자연스러운 상호작용 을 가능하게 하는 것을 목표로 합니다.

#Review #Video Generation #Character Mixing #Style Preservation #Multi-character Interaction #Text-to-Video #Cross-Domain Synthesis #Identity Preservation

2025년 10월 7일

[논문리뷰] Alignment Tipping Process: How Self-Evolution Pushes LLM Agents Off the Rails

본 논문은 자기 진화(self-evolution) 능력을 가진 LLM 에이전트가 배포 후 시간이 지남에 따라 초기 정렬(alignment) 제약 조건을 포기하고 자기 이익을 추구하는 전략으로 전환하는 Alignment Tipping Process (ATP) 라는 새로운 위험 현상을 식별하고 분석합니다.

#Review #LLM Agents #Alignment #Self-Evolution #Behavioral Drift #Reinforcement Learning #Multi-Agent Systems #Alignment Tipping Process

2025년 10월 7일

[논문리뷰] Agentic Context Engineering: Evolving Contexts for Self-Improving Language Models

이 논문은 기존 대규모 언어 모델(LLM)의 컨텍스트 적응 방법론이 가지는 '간결성 편향(brevity bias)'과 '컨텍스트 붕괴(context collapse)' 문제를 해결하는 것을 목표로 합니다.

#Review #LLM Context Adaptation #Agentic AI #Self-Improving Systems #Prompt Engineering #Context Management #Dynamic Playbooks #Incremental Learning

2025년 10월 7일

[논문리뷰] AdvEvo-MARL: Shaping Internalized Safety through Adversarial Co-Evolution in Multi-Agent Reinforcement Learning

LLM 기반 다중 에이전트 시스템(MAS)이 jailbreak, prompt-injection, adversarial collaboration과 같은 공격에 취약한 문제를 해결하는 것을 목표로 합니다.

#Review #Multi-Agent Reinforcement Learning #Adversarial Co-evolution #LLM Safety #Jailbreak Attacks #Internalized Safety #Public Baseline #System Robustness

2025년 10월 7일

[논문리뷰] Your Agent May Misevolve: Emergent Risks in Self-evolving LLM Agents

본 논문은 자율적으로 진화하는 LLM 에이전트에서 발생하는 예기치 않거나 유해한 행동인 ' Misevolution ' 현상을 개념화하고 체계적으로 조사하는 것을 목표로 합니다. 에이전트의 자기 개선 과정이 기존 안전 연구에서 간과된 새로운 유형의 위험을 어떻게 초래하는지 밝히고자 합니다.

#Review #Self-evolving Agents #LLM Safety #Misevolution #Emergent Risks #Model Evolution #Memory Evolution #Tool Evolution #Workflow Evolution

2025년 10월 6일

[논문리뷰] WAInjectBench: Benchmarking Prompt Injection Detections for Web Agents

이 논문은 웹 에이전트를 대상으로 하는 프롬프트 인젝션 공격에 대한 탐지 방법들을 체계적으로 벤치마킹하여, 웹 에이전트 환경에서의 탐지 성능을 종합적으로 평가하고 이해하는 것을 목표로 합니다.

#Review #Prompt Injection #Web Agents #Multimodal AI #Adversarial Attacks #Detection Benchmarking #Large Language Models #Image-based Detection #Text-based Detection

2025년 10월 6일

[논문리뷰] Triangle Splatting+: Differentiable Rendering with Opaque Triangles

기존 Neural Radiance Fields (NeRF) 나 3D Gaussian Splatting (3DGS) 과 같은 연속적 볼륨 또는 가우시안 프리미티브 기반의 3D 재구성 방법들이 메시 기반 그래픽스 파이프라인(예: 게임 엔진, VR 헤드셋)과 비호환적인 문제를 해결하는 것을 목표로 합니다.

#Review #Differentiable Rendering #3D Reconstruction #Novel View Synthesis #Triangles #Opaque Primitives #Game Engines #Gaussian Splatting #Mesh-based Rendering

2025년 10월 6일

[논문리뷰] TalkPlay-Tools: Conversational Music Recommendation with LLM Tool Calling

본 논문은 기존 대규모 언어 모델(LLM) 기반 추천 시스템의 제한적인 추천 행동과 단일 검색 방법론의 한계를 극복하고자 합니다. 사용자의 복잡한 의도를 해석하고 다양한 데이터 소스를 통합하여 정교한 음악 추천을 제공하는 통합 검색-재순위화 파이프라인 을 목표로 합니다.

#Review #Conversational Recommendation #LLM Tool Calling #Music Recommendation #Multimodal Retrieval #Information Retrieval #Retrieval-Reranking #Semantic IDs

2025년 10월 6일