본문으로 건너뛰기

#Agentic Evaluation

4개의 포스트

[논문리뷰] MiniAppBench: Evaluating the Shift from Text to Interactive HTML Responses in LLM-Powered Assistants

댓글 수 로딩 중