[논문리뷰] InfoSynth: Information-Guided Benchmark Synthesis for LLMs대규모 언어 모델(LLM)의 추론 및 코드 생성 능력 평가를 위한 새롭고 다양한 벤치마크를 효율적으로 생성하는 것이 이 논문의 핵심 목표입니다.#Review#Benchmark Synthesis#LLM Evaluation#Code Generation#Information Theory#Genetic Algorithms#Novelty Metrics#Diversity Metrics2026년 1월 4일댓글 수 로딩 중
[논문리뷰] Fast-weight Product Key Memory본 논문은 최신 언어 모델의 시퀀스 모델링 레이어에서 저장 용량과 계산 효율성 사이의 근본적인 트레이드오프를 해결하는 것을 목표로 합니다.#Review#Fast-weight Memory#Product Key Memory#Episodic Memory#Language Models#Long-Context Modeling#Memory Augmented Networks#Continual Learning2026년 1월 4일댓글 수 로딩 중
[논문리뷰] Diversity or Precision? A Deep Dive into Next Token Prediction본 연구는 LLM의 사전 훈련된 토큰 출력 분포가 후속 강화 학습(RL) 을 위한 탐색 공간에 미치는 영향을 체계적으로 조사하는 것을 목표로 합니다. 특히, 다음 토큰 예측 을 확률적 결정 과정으로 재해석하여 다양성과 정밀도 간의 균형이 전체적인 추론 성능에 어떻게 영향을 미치는지 밝히고자 합니다.#Review#Next Token Prediction#Reinforcement Learning#Large Language Models#Reward Shaping#Pre-training Objective#Policy Gradient#Exploration-Exploitation2026년 1월 4일댓글 수 로딩 중
[논문리뷰] Deep Delta Learning본 논문은 딥 잔차 신경망(Deep Residual Networks)의 엄격한 가산적 귀납적 편향(additive inductive bias)으로 인해 복잡한 상태 전이 모델링 능력이 제한되는 문제를 해결하고자 합니다.#Review#Deep Residual Networks#Delta Operator#Geometric Transformation#Spectral Analysis#Gated Networks#Householder Reflection#Dynamical Systems#Identity Shortcut2026년 1월 4일댓글 수 로딩 중
[논문리뷰] Avatar Forcing: Real-Time Interactive Head Avatar Generation for Natural Conversation본 논문은 기존의 단방향적인 아바타 생성 모델들이 부족했던 실시간 양방향 상호작용 과 감정적 참여(emotional engagement) 를 가능하게 하는 대화형 헤드 아바타 생성 시스템을 개발하는 것을 목표로 합니다.#Review#Avatar Generation#Real-Time Interaction#Diffusion Models#Preference Optimization#Causal Inference#Multimodal Input#Head Avatar2026년 1월 4일댓글 수 로딩 중
[논문리뷰] AdaGaR: Adaptive Gabor Representation for Dynamic Scene Reconstruction본 논문은 단일 시점 비디오에서 동적인 3D 장면을 재구성할 때 발생하는 주요 문제점인 고주파수 외형 디테일과 시간적 연속성의 동시 확보를 목표로 합니다.#Review#Dynamic Scene Reconstruction#Gabor Representation#Gaussian Splatting#Temporal Continuity#Cubic Hermite Splines#Frequency Adaptivity#Monocular Video2026년 1월 4일댓글 수 로딩 중
[triton] Proton의 Runtime과 Metric 상관관계 단순화로 오버헤드 감소Proton 프로파일러의 Data/Metric 인터페이스를 재설계하여 이중 잠금과 불필요한 조회를 제거하고 프로파일링 오버헤드를 줄인 사례를 분석합니다.#Triton#Proton#Profiling#Performance#Refactoring2026년 1월 4일댓글 수 로딩 중
[cpython] gh-124951: base64 인코딩/디코딩 2~3배 속도 향상 — CPU 파이프라이닝 최적화lookup table 정렬과 loop-carried dependency 제거로 base64 처리 속도를 2~3배 개선#Python#CPython#Performance#base64#C2026년 1월 2일댓글 수 로딩 중
[논문리뷰] On the Role of Discreteness in Diffusion LLMs본 논문은 확산 모델(Diffusion Models)을 언어 모델링에 적용할 때 발생하는 근본적인 문제점을 분석하고, 텍스트의 이산적이고 구조화된 특성이 확산 메커니즘과 어떻게 불일치하는지 명확히 하는 것을 목표로 합니다.#Review#Diffusion Models#Language Models#Discrete Text#Continuous Diffusion#Text Generation#Data Augmentation#Parallel Decoding#Structural Dependency2026년 1월 1일댓글 수 로딩 중
[논문리뷰] Dynamic Large Concept Models: Latent Reasoning in an Adaptive Semantic Space본 논문은 기존 대규모 언어 모델(LLM)이 언어의 비균일한 정보 밀도에도 불구하고 토큰에 균일한 연산을 적용하여 발생하는 비효율성 문제를 해결하고자 합니다.#Review#Hierarchical Language Model#Concept-Level Reasoning#Dynamic Segmentation#Adaptive Computation#Scaling Laws#Maximal Update Parametrization#Next-Token Prediction#Flash Attention2026년 1월 1일댓글 수 로딩 중
[논문리뷰] DiffThinker: Towards Generative Multimodal Reasoning with Diffusion Models현재 Multimodal Large Language Models (MLLMs)이 겪는 텍스트 중심 추론의 한계와 복잡한 장기 시각 중심 태스크에서의 비효율성을 해결하고, 확산 모델을 활용한 새로운 '생성형 멀티모달 추론' 패러다임을 확립하는 것을 목표로 합니다.#Review#Multimodal Reasoning#Diffusion Models#Image-to-Image Generation#Vision-centric AI#Generative AI#Spatial Planning#Constraint Satisfaction2026년 1월 1일댓글 수 로딩 중
[논문리뷰] mHC: Manifold-Constrained Hyper-Connections논문은 Hyper-Connections (HC) 가 잔여 스트림의 폭을 넓히고 연결성을 다양화하여 성능을 향상시키지만, 항등 매핑(identity mapping) 속성을 손상시켜 심각한 훈련 불안정성, 제한된 확장성, 그리고 상당한 메모리 접근 오버헤드 를 야기하는 문제를 해결하고자 합니다.#Review#Hyper-Connections#Residual Connections#Manifold Learning#Doubly Stochastic Matrices#Training Stability#Large Language Models#Infrastructure Optimization#Deep Learning Architecture2025년 12월 31일댓글 수 로딩 중
[논문리뷰] Youtu-LLM: Unlocking the Native Agentic Potential for Lightweight Large Language Models본 논문은 경량 LLM이 높은 계산 효율성 을 유지하면서도 내재적인 에이전트 지능을 갖출 수 있도록 하는 것을 목표로 합니다. 특히, 기존의 증류(distillation) 방식이 아닌, sub-2B 규모 의 모델이 처음부터 추론 및 계획 능력 을 체계적으로 학습하도록 하는 데 중점을 둡니다.#Review#Lightweight LLM#Agentic AI#Pre-training#Multi-Latent Attention#Long-Context#Curriculum Learning#Agentic Mid-training#Instruction Tuning2025년 12월 31일댓글 수 로딩 중
[논문리뷰] Valori: A Deterministic Memory Substrate for AI Systems현대 AI 시스템, 특히 RAG(Retrieval Augmented Generation) 및 에이전트 워크플로우에서 부동 소수점(floating-point) 연산 으로 인해 발생하는 비결정론적(non-determinism) 메모리 상태 문제를 해결하는 것이 목표입니다.#Review#Deterministic AI#Reproducible Computation#Fixed-Point Arithmetic#Vector Databases#AI Memory#State Machine#Auditability2025년 12월 31일댓글 수 로딩 중
[논문리뷰] SpaceTimePilot: Generative Rendering of Dynamic Scenes Across Space and Time본 연구는 단일 모노큘러 비디오 로부터 동적 장면을 공간(카메라 시점)과 시간(모션 시퀀스)에 걸쳐 독립적으로 제어하며 생성적으로 렌더링하는 것을 목표로 합니다.#Review#Video Diffusion Model#Generative Rendering#Novel View Synthesis#Space-Time Disentanglement#Temporal Control#Camera Control#Dynamic Scenes#Temporal Warping2025년 12월 31일댓글 수 로딩 중
[논문리뷰] Scaling Open-Ended Reasoning to Predict the Future본 연구는 불확실한 미래에 대한 개방형 예측 질문에 대해 언어 모델(LLM)이 정확하고 신뢰할 수 있는 예측을 할 수 있도록 훈련하는 것을 목표로 합니다.#Review#Language Models#Forecasting#Open-Ended Reasoning#Reinforcement Learning (RL)#Data Generation#Calibration#Retrieval-Augmented Generation (RAG)#Future Prediction2025년 12월 31일댓글 수 로딩 중
[논문리뷰] Pretraining Frame Preservation in Autoregressive Video Memory Compression본 논문은 오토회귀 비디오 생성 모델에서 발생하는 긴 비디오 컨텍스트 처리의 한계 와 컨텍스트 품질 및 길이 간의 트레이드오프 문제를 해결하고자 합니다.#Review#Video Compression#Autoregressive Models#Memory Compression#Frame Preservation#Pretraining#Video Generation#Diffusion Models#Long-Range Consistency2025년 12월 31일댓글 수 로딩 중
[논문리뷰] PhyGDPO: Physics-Aware Groupwise Direct Preference Optimization for Physically Consistent Text-to-Video Generation본 논문은 텍스트-투-비디오(T2V) 생성 모델이 높은 시각적 품질에도 불구하고 물리적 일관성 을 갖춘 비디오를 생성하는 데 어려움을 겪는 문제를 해결하고자 합니다.#Review#Text-to-Video Generation#Physics-Aware AI#Direct Preference Optimization#Groupwise Preference Learning#Vision-Language Model#LoRA2025년 12월 31일댓글 수 로딩 중
[논문리뷰] Let It Flow: Agentic Crafting on Rock and Roll, Building the ROME Model within an Open Agentic Learning Ecosystem본 논문은 대규모 언어 모델(LLM)이 복잡하고 다단계의 에이전트 태스크를 실제 환경에서 수행하기 위한 확장 가능하고 종단 간(end-to-end)의 안정적인 에이전트 에코시스템을 구축하는 것을 목표로 합니다.#Review#Agentic Learning Ecosystem#Large Language Models#Reinforcement Learning#Agentic Crafting#Tool Use#ROME Model#Policy Optimization#Sandbox Environment2025년 12월 31일댓글 수 로딩 중
[논문리뷰] JavisGPT: A Unified Multi-modal LLM for Sounding-Video Comprehension and Generation기존 멀티모달 LLM(MLLM)이 이미지-텍스트에 치중하거나 영상과 오디오를 별개로 처리하여 동기화된 사운딩 비디오(synchronized sounding video)의 정밀한 시공간적 정렬을 간과하는 문제를 해결하는 것을 목표로 합니다.#Review#Multimodal LLM#Sounding Video#Video Comprehension#Video Generation#Audio-Video Synchronization#Instruction Tuning#Diffusion Model#Encoder-Decoder2025년 12월 31일댓글 수 로딩 중