[논문리뷰] VenusBench-GD: A Comprehensive Multi-Platform GUI Benchmark for Diverse Grounding TasksarXiv에 게시된 'VenusBench-GD: A Comprehensive Multi-Platform GUI Benchmark for Diverse Grounding Tasks' 논문에 대한 자세한 리뷰입니다.#Review#GUI Grounding#Multi-Platform#Benchmark#MLLM#Hierarchical Evaluation#Human-in-the-Loop Annotation#GUI Agents#Multilingual Dataset2025년 12월 18일댓글 수 로딩 중
[논문리뷰] Hi3DEval: Advancing 3D Generation Evaluation with Hierarchical ValidityZhibing Li이 arXiv에 게시한 'Hi3DEval: Advancing 3D Generation Evaluation with Hierarchical Validity' 논문에 대한 자세한 리뷰입니다.#Review#3D Generation Evaluation#Hierarchical Evaluation#Material Properties#Multi-Agent Annotation#Hybrid Scoring System#Video-based Evaluation#Part-level Analysis2025년 8월 8일댓글 수 로딩 중