[논문리뷰] VEFX-Bench: A Holistic Benchmark for Generic Video Editing and Visual EffectsMinglai Yang이 arXiv에 게시한 'VEFX-Bench: A Holistic Benchmark for Generic Video Editing and Visual Effects' 논문에 대한 자세한 리뷰입니다.#Review#Video Editing#Reward Model#Benchmark#Instruction Following#Human Alignment2026년 4월 19일댓글 수 로딩 중
[논문리뷰] TwinTrack: Post-hoc Multi-Rater Calibration for Medical Image SegmentationarXiv에 게시된 'TwinTrack: Post-hoc Multi-Rater Calibration for Medical Image Segmentation' 논문에 대한 자세한 리뷰입니다.#Review#PDAC#Multi-rater Calibration#Medical Image Segmentation#Isotonic Regression#MHR#Uncertainty Estimation#Deep Ensemble2026년 4월 19일댓글 수 로딩 중
[논문리뷰] TIPSv2: Advancing Vision-Language Pretraining with Enhanced Patch-Text Alignment본 논문은 패치 수준의 증류(distillation) 과정이 정렬 능력을 크게 향상시킨다는 통찰을 바탕으로 TIPSv2 프레임워크를 제안한다. 저자들은 마스킹된 패치뿐만 아니라 모든 패치에 손실을 적용하는 iBOT++ 기법을 통해 학생 모델이 교사 모델의 표현을 더욱 강력하게 학습하도록 유도한다 .#Review#Vision-Language Pretraining#Patch-Text Alignment#iBOT++#Masked Image Modeling#Distillation#Head-only EMA2026년 4월 19일댓글 수 로딩 중
[논문리뷰] Repurposing 3D Generative Model for Autoregressive Layout GenerationarXiv에 게시된 'Repurposing 3D Generative Model for Autoregressive Layout Generation' 논문에 대한 자세한 리뷰입니다.#Review#Autoregressive Layout Generation#3D Generative Models#Diffusion Models#Exposure Bias#Dual-Guidance Self-Rollout2026년 4월 19일댓글 수 로딩 중
[논문리뷰] Qwen3.5-Omni Technical ReportQwen Team이 arXiv에 게시한 'Qwen3.5-Omni Technical Report' 논문에 대한 자세한 리뷰입니다.#Review#Omnimodal#Thinker-Talker Architecture#ARIA#Hybrid MoE#Streaming Inference#Audio-Visual Vibe Coding2026년 4월 19일댓글 수 로딩 중
[논문리뷰] QuantCode-Bench: A Benchmark for Evaluating the Ability of Large Language Models to Generate Executable Algorithmic Trading Strategies본 논문은 400개의 트레이딩 전략 생성 태스크로 구성된 데이터셋을 바탕으로, Compilation, Backtest, Trade, Judge라는 4단계 순차적 검증 파이프라인을 제안한다. 실험은 단일 시도(Single-turn)와 반복 수정이 가능한 Agentic multi-turn 설정에서 진행되었다 .#Review#QuantCode-Bench#Large Language Models#Algorithmic Trading#Backtrader#Code Generation#Agentic Workflow#Domain-Specific Benchmarking2026년 4월 19일댓글 수 로딩 중
[논문리뷰] PersonaVLM: Long-Term Personalized Multimodal LLMsarXiv에 게시된 'PersonaVLM: Long-Term Personalized Multimodal LLMs' 논문에 대한 자세한 리뷰입니다.#Review#Multimodal Large Language Models#Long-term Personalization#Memory Architecture#Personality Alignment#Agent Framework#Reinforcement Learning2026년 4월 19일댓글 수 로딩 중
[논문리뷰] PRL-Bench: A Comprehensive Benchmark Evaluating LLMs' Capabilities in Frontier Physics ResearchYuelin Hu이 arXiv에 게시한 'PRL-Bench: A Comprehensive Benchmark Evaluating LLMs' Capabilities in Frontier Physics Research' 논문에 대한 자세한 리뷰입니다.#Review#PRL-Bench#LLMs#Scientific Benchmarks#Physics Research#End-to-End Workflow#Long-horizon Reasoning#Agentic Science2026년 4월 19일댓글 수 로딩 중
[논문리뷰] NTIRE 2026 Challenge on Video Saliency Prediction: Methods and Results본 챌린지에서는 총 2,000개의 다양한 비디오로 구성된 새로운 데이터셋을 활용하였으며, 7개의 최종 팀이 제안한 모델들을 평가했습니다. 우승 팀인 iLearn은 InternVideo2 백본을 공유하고 두 개의 상호 보완적인 디코더를 앙상블(Ensemble)하는 다중 전문가 프레임워크를 제안했습니다 .#Review#Video Saliency Prediction#Crowdsourcing#Foundation Models#Spatiotemporal Modeling#NTIRE 2026 Challenge2026년 4월 19일댓글 수 로딩 중
[논문리뷰] Learning Adaptive Reasoning Paths for Efficient Visual ReasoningMuhao Chen이 arXiv에 게시한 'Learning Adaptive Reasoning Paths for Efficient Visual Reasoning' 논문에 대한 자세한 리뷰입니다.#Review#Vision-Language Models#Visual Reasoning#Overthinking#Reinforcement Learning#Chain-of-Thought#Efficiency2026년 4월 19일댓글 수 로딩 중
[논문리뷰] Hierarchical Codec Diffusion for Video-to-Speech GenerationarXiv에 게시된 'Hierarchical Codec Diffusion for Video-to-Speech Generation' 논문에 대한 자세한 리뷰입니다.#Review#Video-to-Speech#Discrete Diffusion Models#Hierarchical Modeling#Audio-Visual Alignment#Residual Vector Quantization#Transformer2026년 4월 19일댓글 수 로딩 중
[논문리뷰] GTA-2: Benchmarking General Tool Agents from Atomic Tool-Use to Open-Ended WorkflowsYijun Wang이 arXiv에 게시한 'GTA-2: Benchmarking General Tool Agents from Atomic Tool-Use to Open-Ended Workflows' 논문에 대한 자세한 리뷰입니다.#Review#Autonomous LLM Agents#Agent Evaluation#General AI Assistant#Tool-use#Workflow Management2026년 4월 19일댓글 수 로딩 중
[논문리뷰] Elucidating the SNR-t Bias of Diffusion Probabilistic Models저자들은 SNR-t bias를 완화하기 위해 DCW (Differential Correction in Wavelet domain)를 제안합니다 . 이 방법론은 학습 없이(training-free) 추론 단계에서 적용 가능한 플러그 앤 플레이 방식의 differential correction을 수행합니다.#Review#Diffusion Probabilistic Models#SNR-t Bias#Differential Correction#Wavelet Domain#Generation Quality#Training-free2026년 4월 19일댓글 수 로딩 중
[논문리뷰] EdgeDetect: Importance-Aware Gradient Compression with Homomorphic Aggregation for Federated Intrusion Detection본 논문은 Gradient Smartification 기법을 제안하여 로컬 그래디언트를 이진 표현으로 압축함으로써 통신 페이로드 크기를 최대 32배까지 감소시켰습니다. 이 과정에서 중앙값 기반의 적응형 임계값을 적용하여 기존 signSGD 방식의 고정 임계값 문제(노이즈 발생 및 불안정성)를 해결했습니다.#Review#Federated Learning#Intrusion Detection#Gradient Compression#Homomorphic Encryption#6G-IoT#Median-Thresholding2026년 4월 19일댓글 수 로딩 중
[논문리뷰] DiPO: Disentangled Perplexity Policy Optimization for Fine-grained Exploration-Exploitation Trade-OffarXiv에 게시된 'DiPO: Disentangled Perplexity Policy Optimization for Fine-grained Exploration-Exploitation Trade-Off' 논문에 대한 자세한 리뷰입니다.#Review#Large Language Models#Reinforcement Learning#Exploration-Exploitation Trade-Off#Perplexity#Reward Shaping2026년 4월 19일댓글 수 로딩 중
[논문리뷰] Can Large Language Models Reinvent Foundational Algorithms?본 연구는 GRPO 기반의 on-policy unlearning과 cold start 단계를 결합하여 타겟 알고리즘 지식을 모델에서 제거합니다. 재발명 단계에서는 Python interpreter와 상호작용하며, 실패 시 Generative Verifier가 제공하는 진단 피드백을 통해 솔루션을 수정합니다.#Review#Large Language Models#LLM Unlearning#Algorithmic Invention#GRPO#Test-time Reinforcement Learning2026년 4월 19일댓글 수 로딩 중
[논문리뷰] ArtifactNet: Detecting AI-Generated Music via Forensic Residual Physics본 논문은 AI 생성 음악을 탐지하는 문제를 물리적 포렌식 잔차를 분석하는 과정으로 재정의하는 ArtifactNet 프레임워크를 제안한다. 시스템은 크게 3단계로 구성되는데, ArtifactUNet을 통한 포렌식 잔차 추출, HPSS를 활용한 7채널 특징 생성, 그리고 최종 판단을 위한 경량 CNN 분류로 이어진다.#Review#AI-generated music#Forensic physics#Residual Vector Quantization#ArtifactNet#ArtifactBench#Codec-aware training#HPSS2026년 4월 19일댓글 수 로딩 중
[논문리뷰] AccelOpt: A Self-Improving LLM Agentic System for AI Accelerator Kernel OptimizationarXiv에 게시된 'AccelOpt: A Self-Improving LLM Agentic System for AI Accelerator Kernel Optimization' 논문에 대한 자세한 리뷰입니다.#Review#LLM Agent#Kernel Optimization#AI Accelerator#Amazon Trainium#Beam Search#Optimization Memory2026년 4월 19일댓글 수 로딩 중
[논문리뷰] (1D) Ordered Tokens Enable Efficient Test-Time Search본 논문은 SoTo 프레임워크를 제안하여 다양한 tokenizer 구조, search 알고리즘, verifier, 그리고 AR prior의 상호작용을 체계적으로 분석합니다 . 제안 방법론은 FlexTok과 같은 1D ordered tokenizer를 활용하여, 중간 토큰 시퀀스가 전체 이미지의 전역적인 의미를 담도록 학습시킵니다.#Review#tokenization#test-time scaling#autoregressive model#search#coarse-to-fine2026년 4월 19일댓글 수 로딩 중
[논문리뷰] Towards Autonomous Mechanistic Reasoning in Virtual Cells본 논문은 생물학적 추론을 Directed Acyclic Graph(DAG) 형태로 공식화하여 추론 과정을 명확히 정의하고 검증 가능하게 만듭니다 . 제안하는 VCR-Agent는 보고서 생성기(Report Generator)와 설명 생성기(Explanation Constructor)라는 두 단계 파이프라인으로 구성되어 있습니다.#Review#Virtual Cells#Large Language Models#Mechanistic Reasoning#Structured Explanation#Knowledge Retrieval#Verifier-based Filtering2026년 4월 16일댓글 수 로딩 중