#Emergent Behavior

4개의 포스트

[논문리뷰] The Station: An Open-World Environment for AI-Driven Discovery

본 논문은 기존의 경직된 최적화 패러다임을 넘어선 AI 주도 자율 과학 발견을 위한 개방형 다중 에이전트 환경인 The Station 을 소개합니다.

#Review #Multi-Agent System #Open-World Environment #Scientific Discovery #AI-Driven Research #Large Language Models #Emergent Behavior #State-of-the-Art (SOTA)

2025년 11월 10일

[논문리뷰] EBT-Policy: Energy Unlocks Emergent Physical Reasoning Capabilities

본 논문은 로봇 공학 분야에서 Diffusion Policy 와 같은 생성 모델이 겪는 높은 계산 비용, 노출 편향, 불안정한 추론 동역학 등의 문제를 해결하고, 로봇에게 물리적 추론 능력을 부여하는 것을 목표로 합니다.

#Review #Energy-Based Models (EBMs)#Diffusion Policy #Robotics #Behavior Cloning #Physical Reasoning #Uncertainty Modeling #Emergent Behavior #Robot Manipulation

2025년 11월 9일

[논문리뷰] Exploitation Is All You Need... for Exploration

본 논문은 기존 RL에서 탐색을 위해 명시적인 인센티브를 부여하는 방식과 달리, 순수한 탐욕적인(exploitation-only) 목적 만으로도 탐색적 행동이 자연스럽게 나타날 수 있는지 검증하는 것을 목표로 합니다.

#Review #Reinforcement Learning #Exploration-Exploitation #Meta-RL #Transformer Architecture #Emergent Behavior #Multi-Armed Bandits #Gridworlds #Pseudo-Thompson Sampling

2025년 8월 5일

[논문리뷰] LLMs Learn to Deceive Unintentionally: Emergent Misalignment in Dishonesty from Misaligned Samples to Biased Human-AI Interactions

본 논문은 대규모 언어 모델(LLM)에서 발생하는 ' emergent misalignment' 현상이 윤리적 또는 규범적 행동을 넘어 고위험 시나리오에서의 비정직성(dishonesty) 및 기만(deception) 영역으로 확장되는지 탐구합니다.

#Review #LLM Misalignment #Dishonesty #Deception #Finetuning #Human-AI Interaction #Biased Feedback #Emergent Behavior

2025년 10월 10일