[논문리뷰] Target-Oriented Pretraining Data Selection via Neuron-Activated GrapharXiv에 게시된 'Target-Oriented Pretraining Data Selection via Neuron-Activated Graph' 논문에 대한 자세한 리뷰입니다.#Review#Large Language Models#Pretraining Data Selection#Neuron-Activated Graph#Target-Oriented Pretraining#Interpretability2026년 4월 21일댓글 수 로딩 중
[논문리뷰] TEMPO: Scaling Test-time Training for Large Reasoning ModelsMinghao Wu이 arXiv에 게시한 'TEMPO: Scaling Test-time Training for Large Reasoning Models' 논문에 대한 자세한 리뷰입니다.#Review#Test-time Training#Large Reasoning Models#Expectation-Maximization#Actor-Critic#Reinforcement Learning#Scalability#Diversity2026년 4월 21일댓글 수 로딩 중
[논문리뷰] Speculative Decoding for Autoregressive Video Generation본 논문은 이미지 품질 라우터를 사용하여 블록별로 드래프트된 결과물을 수락하거나 타겟 모델로 재생성하는 SDVG 프레임워크를 제안합니다. 드래프터는 4번의 Denoising step을 통해 후보 블록을 생성하며, 이는 Worst-frame aggregation을 통해 ImageReward로 평가됩니다 .#Review#Speculative Decoding#Autoregressive Video Generation#Video Diffusion#Training-free#ImageReward2026년 4월 21일댓글 수 로딩 중
[논문리뷰] ShadowPEFT: Shadow Network for Parameter-Efficient Fine-TuningarXiv에 게시된 'ShadowPEFT: Shadow Network for Parameter-Efficient Fine-Tuning' 논문에 대한 자세한 리뷰입니다.#Review#Parameter-Efficient Fine-Tuning#Shadow Network#Large Language Models#Modular Deployment#Edge Computing2026년 4월 21일댓글 수 로딩 중
[논문리뷰] PlayCoder: Making LLM-Generated GUI Code Playable본 논문은 GUI 행동의 정확성을 검증하고 이를 기반으로 코드를 반복적으로 수정하는 다중 에이전트 프레임워크인 PlayCoder를 제안합니다 . PlayDeveloper는 리포지토리 문맥을 활용하여 초기 코드를 생성하고, PlayTester는 GUI를 직접 실행하며 시각적/기능적 결함을 진단합니다.#Review#Large Language Model#Code Generation#Multi-Agent#GUI Applications#Automated Program Repair2026년 4월 21일댓글 수 로딩 중
[논문리뷰] MoVE: Translating Laughter and Tears via Mixture of Vocalization Experts in Speech-to-Speech TranslationHung-yi Lee이 arXiv에 게시한 'MoVE: Translating Laughter and Tears via Mixture of Vocalization Experts in Speech-to-Speech Translation' 논문에 대한 자세한 리뷰입니다.#Review#Speech-to-Speech Translation#Non-verbal Vocalizations#Mixture of Experts#AudioLLMs#Expressive Speech#Data Efficiency2026년 4월 21일댓글 수 로딩 중
[논문리뷰] Mind's Eye: A Benchmark of Visual Abstraction, Transformation and Composition for Multimodal LLMsarXiv에 게시된 'Mind's Eye: A Benchmark of Visual Abstraction, Transformation and Composition for Multimodal LLMs' 논문에 대한 자세한 리뷰입니다.#Review#Multimodal LLMs#Visuospatial Reasoning#Fluid Intelligence#Mental Transformation#ART Taxonomy#Cognitive Benchmark2026년 4월 21일댓글 수 로딩 중
[논문리뷰] MM-JudgeBias: A Benchmark for Evaluating Compositional Biases in MLLM-as-a-Judge본 연구는 29개의 기존 데이터셋에서 추출한 1,804개의 샘플을 바탕으로 9가지 유형의 편향을 분석하는 MM-JudgeBias 벤치마크를 구축하였다. 제안된 프레임워크는 각 샘플에 대해 편향되지 않은(unbiased) triplet과 편향을 주입한(biased) triplet을 생성하여 평가 결과의 차이를 비교한다.#Review#Multimodal Large Language Models#MLLM-as-a-Judge#Compositional Bias#Benchmark#Bias-Deviation#Bias-Conformity2026년 4월 21일댓글 수 로딩 중
[논문리뷰] LoopCTR: Unlocking the Loop Scaling Power for Click-Through Rate Prediction본 논문은 LoopCTR을 제안하며, 이는 재귀적 루프 블록을 통해 파라미터 효율성을 극대화한 Sandwich architecture를 채택한다. Loop Block 내의 표현력을 높이기 위해 MoE-Augmented Transformer를 적용하고, Hyper-Connected Residuals (HCR)를 도입하여 정보 흐름을 동적으로 조정한다 .#Review#CTR Prediction#Loop Scaling#Transformer#Mixture-of-Experts#Hyper-Connected Residuals#Parameter Efficiency#Process Supervision2026년 4월 21일댓글 수 로딩 중
[논문리뷰] HP-Edit: A Human-Preference Post-Training Framework for Image EditingJiaqi Xu이 arXiv에 게시한 'HP-Edit: A Human-Preference Post-Training Framework for Image Editing' 논문에 대한 자세한 리뷰입니다.#Review#Image Editing#Human-Preference Alignment#Reinforcement Learning#Flow Matching#Visual Large Language Model2026년 4월 21일댓글 수 로딩 중
[논문리뷰] Evaluation-driven Scaling for Scientific DiscoveryCaiyin Yang이 arXiv에 게시한 'Evaluation-driven Scaling for Scientific Discovery' 논문에 대한 자세한 리뷰입니다.#Review#Test-Time Scaling#Scientific Discovery#Evaluation-driven Discovery#LLM#Optimization#Symbolic Laws#GPU Kernel2026년 4월 21일댓글 수 로딩 중
[논문리뷰] Dual-View Training for Instruction-Following Information RetrievalarXiv에 게시된 'Dual-View Training for Instruction-Following Information Retrieval' 논문에 대한 자세한 리뷰입니다.#Review#Instruction-Following#Information Retrieval#Dual-View Training#Polarity Reversal#Contrastive Learning2026년 4월 21일댓글 수 로딩 중
[논문리뷰] Contrastive Attribution in the Wild: An Interpretability Analysis of LLM Failures on Realistic BenchmarksarXiv에 게시된 'Contrastive Attribution in the Wild: An Interpretability Analysis of LLM Failures on Realistic Benchmarks' 논문에 대한 자세한 리뷰입니다.#Review#LLM Interpretability#Contrastive Attribution#Layer-wise Relevance Propagation#Attribution Graph#Failure Analysis#Transformer2026년 4월 21일댓글 수 로딩 중
[논문리뷰] Code-Switching Information Retrieval: Benchmarks, Analysis, and the Limits of Current Retrievers본 논문은 코드 스위칭 검색 시스템의 성능 평가를 위해 인간이 주석을 단 CSR-L 벤치마크를 구축하고, 11개 작업을 포함하는 CS-MTEB를 통해 그 영향력을 정량적으로 분석하였다. 실험 결과, 쿼리 내 코드 스위칭만으로도 강력한 다국어 모델을 포함한 대부분의 시스템에서 유의미한 성능 저하가 발생함이 확인되었다.#Review#Information Retrieval#Code-Switching#Benchmark#Embedding Models#Robustness#Late-Interaction#Lexicon-Based Adaptation2026년 4월 21일댓글 수 로딩 중
[논문리뷰] CoInteract: Physically-Consistent Human-Object Interaction Video Synthesis via Spatially-Structured Co-GenerationarXiv에 게시된 'CoInteract: Physically-Consistent Human-Object Interaction Video Synthesis via Spatially-Structured Co-Generation' 논문에 대한 자세한 리뷰입니다.#Review2026년 4월 21일댓글 수 로딩 중
[논문리뷰] ClawNet: Human-Symbiotic Agent Network for Cross-User Autonomous CooperationWei Xue이 arXiv에 게시한 'ClawNet: Human-Symbiotic Agent Network for Cross-User Autonomous Cooperation' 논문에 대한 자세한 리뷰입니다.#Review#Human-Symbiotic#Agent Framework#Identity Governance#Scoped Authorization#Accountability#Cross-User Collaboration2026년 4월 21일댓글 수 로딩 중
[논문리뷰] Chat2Workflow: A Benchmark for Generating Executable Visual Workflows with Natural LanguagearXiv에 게시된 'Chat2Workflow: A Benchmark for Generating Executable Visual Workflows with Natural Language' 논문에 대한 자세한 리뷰입니다.#Review#Agentic Workflow#Benchmark#Large Language Models#Visual Programming#Executable Workflow#Task Automation2026년 4월 21일댓글 수 로딩 중
[논문리뷰] Chain-of-Thought Degrades Visual Spatial Reasoning Capabilities of Multimodal LLMs저자들은 다양한 규모의 MRM 및 MLM 백본을 대상으로 CoT와 Non-CoT 프롬프트를 비교 평가하는 방법론을 수행하였습니다. 실험 결과, 17개 중 대다수의 모델에서 CoT 프롬프트를 사용했을 때 시각적 공간 추론 정확도가 평균적으로 하락하는 경향이 관찰되었습니다 .#Review#Multimodal Reasoning Models#Chain-of-Thought#Visual Spatial Reasoning#Shortcut Learning#Hallucination#No-Image Ablation2026년 4월 21일댓글 수 로딩 중
[논문리뷰] AnyRecon: Arbitrary-View 3D Reconstruction with Video Diffusion ModelTianshuo Yang이 arXiv에 게시한 'AnyRecon: Arbitrary-View 3D Reconstruction with Video Diffusion Model' 논문에 대한 자세한 리뷰입니다.#Review#3D Reconstruction#Video Diffusion Model#Sparse-view#Geometry-Aware#Global Scene Memory2026년 4월 21일댓글 수 로딩 중
[논문리뷰] Web Retrieval-Aware Chunking (W-RAC) for Efficient and Cost-Effective Retrieval-Augmented Generation Systems본 논문은 문서 청킹을 텍스트 생성이 아닌 '계획 문제(Planning Problem)'로 재정의하여 W-RAC를 제안합니다. 이 시스템은 세 단계로 구성되는데, 먼저 웹 콘텐츠를 구조화하여 ID를 할당하고, LLM은 오직 ID 리스트 기반의 최적 그룹화 계획만을 수립하며, 마지막으로 로컬에서 ID를 매핑하여 최종 청크를 조립합니다 .#Review#Retrieval-Augmented Generation#Document Chunking#Web Parsing#Cost-Efficiency#Semantic Planning#Scalability2026년 4월 19일댓글 수 로딩 중