[논문리뷰] AutoCodeBench: Large Language Models are Automatic Code Benchmark GeneratorsTao Zhang이 arXiv에 게시한 'AutoCodeBench: Large Language Models are Automatic Code Benchmark Generators' 논문에 대한 자세한 리뷰입니다.#Review#코드 생성#대규모 언어 모델#코드 벤치마크#다국어 프로그래밍#자동화된 데이터 생성#샌드박스 평가#멀티모달 AI2025년 8월 13일댓글 수 로딩 중