Review

[논문리뷰] Boolean Satisfiability via Imitation Learning

Xiangyu Xu이 arXiv에 게시한 'Boolean Satisfiability via Imitation Learning' 논문에 대한 자세한 리뷰입니다.

#Review #Boolean Satisfiability #Imitation Learning #CDCL Solvers #Branching Policy #KeyTrace #Transformer Architecture #Perceiver AR

2025년 10월 2일

[논문리뷰] BindWeave: Subject-Consistent Video Generation via Cross-Modal Integration

Xiangyang Xia이 arXiv에 게시한 'BindWeave: Subject-Consistent Video Generation via Cross-Modal Integration' 논문에 대한 자세한 리뷰입니다.

#Review #Video Generation #Subject Consistency #Cross-Modal Integration #Diffusion Models #Multimodal LLM #Diffusion Transformer #Text-to-Video

2025년 10월 2일

[논문리뷰] BiasFreeBench: a Benchmark for Mitigating Bias in Large Language Model Responses

Julian McAuley이 arXiv에 게시한 'BiasFreeBench: a Benchmark for Mitigating Bias in Large Language Model Responses' 논문에 대한 자세한 리뷰입니다.

#Review #LLM Bias Mitigation #Benchmark #Evaluation Metrics #Prompt Engineering #Fine-tuning #Bias-Free Score #Fairness

2025년 10월 2일

[논문리뷰] Beyond Log Likelihood: Probability-Based Objectives for Supervised Fine-Tuning across the Model Capability Continuum

Hanghang Tong이 arXiv에 게시한 'Beyond Log Likelihood: Probability-Based Objectives for Supervised Fine-Tuning across the Model Capability Continuum' 논문에 대한 자세한 리뷰입니다.

#Review #Supervised Fine-tuning (SFT)#Large Language Models (LLMs)#Training Objectives #Negative Log Likelihood (NLL)#Model Capability Continuum #Generalization #Probability-based Loss Functions

2025년 10월 2일

[논문리뷰] An Empirical Study of Testing Practices in Open Source AI Agent Frameworks and Agentic Applications

Bram Adams이 arXiv에 게시한 'An Empirical Study of Testing Practices in Open Source AI Agent Frameworks and Agentic Applications' 논문에 대한 자세한 리뷰입니다.

#Review #AI Agent #LLM Agent #Testing #Empirical Study #Software Quality #Agent Frameworks #Agentic Applications #Non-Determinism

2025년 10월 2일

[논문리뷰] ACON: Optimizing Context Compression for Long-horizon LLM Agents

arXiv에 게시된 'ACON: Optimizing Context Compression for Long-horizon LLM Agents' 논문에 대한 자세한 리뷰입니다.

#Review #LLM Agents #Context Compression #Long-horizon Tasks #Prompt Optimization #Knowledge Distillation #Memory Efficiency #Task Performance #Failure Analysis

2025년 10월 2일

[논문리뷰] jina-reranker-v3: Last but Not Late Interaction for Document Reranking

arXiv에 게시된 'jina-reranker-v3: Last but Not Late Interaction for Document Reranking' 논문에 대한 자세한 리뷰입니다.

#Review #Document Reranking #Last but Not Late Interaction #Multilingual #Transformer Architecture #Cross-Encoder #InfoNCE Loss #Contextual Embedding #Qwen3

2025년 10월 1일

[논문리뷰] dParallel: Learnable Parallel Decoding for dLLMs

arXiv에 게시된 'dParallel: Learnable Parallel Decoding for dLLMs' 논문에 대한 자세한 리뷰입니다.

#Review #Diffusion Language Models #Parallel Decoding #Inference Acceleration #Certainty Distillation #Self-Distillation #Masked Language Models #LLaDA

2025년 10월 1일

[논문리뷰] d^2Cache: Accelerating Diffusion-Based LLMs via Dual Adaptive Caching

Jiarui Wang이 arXiv에 게시한 'd^2Cache: Accelerating Diffusion-Based LLMs via Dual Adaptive Caching' 논문에 대한 자세한 리뷰입니다.

#Review #Diffusion Models #Large Language Models (LLMs)#Inference Acceleration #KV Cache #Bidirectional Attention #Adaptive Caching #Token Selection

2025년 10월 1일

[논문리뷰] Winning the Pruning Gamble: A Unified Approach to Joint Sample and Token Pruning for Efficient Supervised Fine-Tuning

Yue Min이 arXiv에 게시한 'Winning the Pruning Gamble: A Unified Approach to Joint Sample and Token Pruning for Efficient Supervised Fine-Tuning' 논문에 대한 자세한 리뷰입니다.

#Review #LLM SFT #Data Pruning #Sample Pruning #Token Pruning #Error-Uncertainty Plane #Q-Tuning #Data Efficiency #Dynamic Pruning

2025년 10월 1일

[논문리뷰] Who's Your Judge? On the Detectability of LLM-Generated Judgments

arXiv에 게시된 'Who's Your Judge? On the Detectability of LLM-Generated Judgments' 논문에 대한 자세한 리뷰입니다.

#Review #LLM-as-a-judge #Judgment Detection #Bias Quantification #Feature Engineering #Interpretability #Peer Review #AI Ethics #Evaluation

2025년 10월 1일

[논문리뷰] Who invented deep residual learning?

Juergen Schmidhuber이 arXiv에 게시한 'Who invented deep residual learning?' 논문에 대한 자세한 리뷰입니다.

#Review #Deep Learning History #Residual Connections #Recurrent Neural Networks (RNN)#Long Short-Term Memory (LSTM)#Feedforward Neural Networks (FNN)#Highway Networks #ResNet #Vanishing Gradient

2025년 10월 1일

[논문리뷰] Voice Evaluation of Reasoning Ability: Diagnosing the Modality-Induced Performance Gap

Hengfan Zhang이 arXiv에 게시한 'Voice Evaluation of Reasoning Ability: Diagnosing the Modality-Induced Performance Gap' 논문에 대한 자세한 리뷰입니다.

#Review #Voice AI #LLM #Reasoning #Benchmark #Modality Gap #Latency #Speech Recognition #Generative AI #Real-time Systems #Conversational AI

2025년 10월 1일

[논문리뷰] VitaBench: Benchmarking LLM Agents with Versatile Interactive Tasks in Real-world Applications

arXiv에 게시된 'VitaBench: Benchmarking LLM Agents with Versatile Interactive Tasks in Real-world Applications' 논문에 대한 자세한 리뷰입니다.

#Review #LLM Agents #Benchmarking #Interactive Tasks #Real-world Applications #Tool Use #Multi-turn Conversation #Task Complexity

2025년 10월 1일

[논문리뷰] VisualOverload: Probing Visual Understanding of VLMs in Really Dense Scenes

Muhammad Huzaifa이 arXiv에 게시한 'VisualOverload: Probing Visual Understanding of VLMs in Really Dense Scenes' 논문에 대한 자세한 리뷰입니다.

#Review #Visual Question Answering #Multimodal Models #Dense Scenes #Fine-Grained Perception #Benchmark #Error Analysis #Counting #OCR

2025년 10월 1일

[논문리뷰] Vision-Zero: Scalable VLM Self-Improvement via Strategic Gamified Self-Play

Jing Shi이 arXiv에 게시한 'Vision-Zero: Scalable VLM Self-Improvement via Strategic Gamified Self-Play' 논문에 대한 자세한 리뷰입니다.

#Review #Vision-Language Models (VLMs)#Self-Play #Reinforcement Learning #Gamification #Data Efficiency #Strategic Reasoning #Multimodal AI #Self-Improvement

2025년 10월 1일

[논문리뷰] TruthRL: Incentivizing Truthful LLMs via Reinforcement Learning

arXiv에 게시된 'TruthRL: Incentivizing Truthful LLMs via Reinforcement Learning' 논문에 대한 자세한 리뷰입니다.

#Review #LLM Hallucination #Truthfulness #Reinforcement Learning #Ternary Reward #Abstention #Knowledge Boundary #GRPO #RLHF

2025년 10월 1일

[논문리뷰] Thinking Sparks!: Emergent Attention Heads in Reasoning Models During Post Training

arXiv에 게시된 'Thinking Sparks!: Emergent Attention Heads in Reasoning Models During Post Training' 논문에 대한 자세한 리뷰입니다.

#Review #Mechanistic Interpretability #Attention Heads #Post-Training #Supervised Fine-Tuning (SFT)#Reinforcement Learning (RL)#Circuit Analysis #Reasoning Models #Transformer Architecture

2025년 10월 1일

[논문리뷰] The Dragon Hatchling: The Missing Link between the Transformer and Models of the Brain

arXiv에 게시된 'The Dragon Hatchling: The Missing Link between the Transformer and Models of the Brain' 논문에 대한 자세한 리뷰입니다.

#Review #Large Language Models #Brain-Inspired AI #Graph Neural Networks #Hebbian Learning #Scale-Free Networks #Model Interpretability #Transformer Architecture

2025년 10월 1일

[논문리뷰] Test-Time Policy Adaptation for Enhanced Multi-Turn Interactions with LLMs

Yao Shu이 arXiv에 게시한 'Test-Time Policy Adaptation for Enhanced Multi-Turn Interactions with LLMs' 논문에 대한 자세한 리뷰입니다.

#Review #Large Language Models #Multi-turn Interaction #Test-Time Adaptation #Reinforcement Learning from Human Feedback #Policy Optimization #Online Learning #Self-Correction

2025년 10월 1일