[논문리뷰] N-GRPO: Embedding-Level Neighbor Mixing for Enhanced Policy Optimization본 연구는 LLM의 강화학습 과정 중 Rollout 단계에서 발생하는 효과적인 탐색(Exploration)의 부족과 기존 방법론의 한계점을 해결하고자 합니다.#Review#Reinforcement Learning#Large Language Models#GRPO#Semantic Neighbor Mixing#Policy Optimization#Embedding Space#Latent Reasoning2026년 6월 11일댓글 수 로딩 중
[논문리뷰] DMax: Aggressive Parallel Decoding for dLLMs본 논문은 dLLM을 위한 DMax 패러다임을 제안하며, 이는 예측의 self-refinement 과정을 임베딩 공간 내의 변환으로 재구성합니다. 핵심 기법인 OPUT은 학습 시 모델 스스로의 예측을 통해 noisy input을 구성함으로써 train-inference 간의 불일치를 줄여 자가 수정 능력을 극대화합니다 .#Review#Diffusion Language Models#Parallel Decoding#Error Accumulation#On-Policy Training#Self-Correction#Embedding Space2026년 4월 9일댓글 수 로딩 중
[논문리뷰] Unveiling Intrinsic Dimension of Texts: from Academic Abstract to Creative Story본 논문은 현대 LLM 분석에 중요한 도구인 Intrinsic Dimension (ID) 의 텍스트 기반 결정 요인을 밝히는 것을 목표로 합니다.#Review#Intrinsic Dimension#LLMs#Text Complexity#Sparse Autoencoders#Text Semantics#Genre Analysis#Embedding Space#Text Generation2025년 11월 23일댓글 수 로딩 중
[논문리뷰] Tensor Logic: The Language of AIAI 분야의 발전이 프로그래밍 언어의 한계로 인해 저해되고 있다는 문제의식에서 출발합니다. PyTorch나 TensorFlow와 같은 라이브러리가 자동 미분과 GPU 가속을 제공하지만, 자동 추론 및 지식 습득 기능이 부족하며, LISP나 Prolog 같은 심볼릭 AI 언어는 확장성과 학습 지원이 미비합니다.#Review#Tensor Logic#Neurosymbolic AI#Logic Programming#Tensor Algebra#Deep Learning#Automated Reasoning#Embedding Space2025년 10월 15일댓글 수 로딩 중