본문으로 건너뛰기

#MLLM-as-a-Judge

7개의 포스트

[논문리뷰] MM-JudgeBias: A Benchmark for Evaluating Compositional Biases in MLLM-as-a-Judge

댓글 수 로딩 중

[논문리뷰] T2AV-Compass: Towards Unified Evaluation for Text-to-Audio-Video Generation

댓글 수 로딩 중

[논문리뷰] MultiRef: Controllable Image Generation with Multiple Visual References

댓글 수 로딩 중

[논문리뷰] UniME-V2: MLLM-as-a-Judge for Universal Multimodal Embedding Learning

댓글 수 로딩 중

[논문리뷰] MLLM as a UI Judge: Benchmarking Multimodal LLMs for Predicting Human Perception of User Interfaces

댓글 수 로딩 중

[논문리뷰] VISTA: A Test-Time Self-Improving Video Generation Agent

댓글 수 로딩 중