#Generalist AI

4개의 포스트

[논문리뷰] Nanbeige4.1-3B: A Small General Model that Reasons, Aligns, and Acts

컴팩트한 30억(3B) 파라미터 규모의 모델인 Nanbeige4.1-3B 를 개발하여 강력한 에이전트 행동, 코드 생성 및 일반적인 추론 능력을 동시에 달성하는 것을 목표로 합니다. 단일 소규모 언어 모델(SLM) 내에서 이러한 다재다능성을 입증하고, 3B 파라미터 모델의 잠재력을 재정의하고자 합니다.

#Review #Small Language Model #Generalist AI #Reasoning #Code Generation #Agentic Behavior #Reinforcement Learning #Tool Use #Deep Search

2026년 2월 16일

[논문리뷰] Generalist Large Language Models Outperform Clinical Tools on Medical Benchmarks

의료 분야에서 전문 임상 AI 도구들이 일반 목적의 대규모 언어 모델(LLM)보다 안전하고 신뢰할 수 있다는 주장에도 불구하고, 독립적이고 정량적인 평가가 부족하다는 문제를 해결하고자 합니다.

#Review #Large Language Models #Clinical AI #Medical Benchmarks #AI Evaluation #Medical Decision Support #MedQA #HealthBench #Generalist AI

2025년 12월 1일

[논문리뷰] Game-TARS: Pretrained Foundation Models for Scalable Generalist Multimodal Game Agents

본 논문은 기존 API 또는 GUI 기반 접근 방식의 한계로 인한 확장성 및 일반화 능력 부족 문제를 해결하고자 합니다.

#Review #Generalist AI #Game Agents #Multimodal Learning #Foundation Models #ReAct #Sparse Thinking #Continual Pre-training #Human-Native Interaction

2025년 10월 29일

[논문리뷰] Omni-Reward: Towards Generalist Omni-Modal Reward Modeling with Free-Form Preferences

본 논문은 기존 보상 모델(RMs)의 두 가지 주요 한계, 즉 모달리티 불균형(Modality Imbalance) (텍스트 및 이미지 외 모달리티 지원 부족)과 선호도 경직성(Preference Rigidity) (고정된 이진 선호 쌍으로는 복잡하고 개인화된 선호도 포착 불가)을 해결하고자 합니다.

#Review #Reward Modeling #Multimodal AI #Human Preferences #RLHF #Generalist AI #Benchmark #Dataset #Free-Form Preferences

2025년 10월 28일