Benchmark Detail

BFCL

함수 호출: API 호출형 agent, 플러그인, 업무 자동화

공식 리더보드 보기 챗봇이 아니라 실제 서비스를 조작하는 AI를 만들 때 중요합니다.

점수 그래프

왼쪽부터 높은 순서
아직 공개 점수를 연결하지 않았습니다. 점수가 확인되는 모델만 추가할 예정입니다.

Berkeley Function Calling Leaderboard. 함수 호출과 tool use 정확도를 봅니다.

챗봇이 아니라 실제 서비스를 조작하는 AI를 만들 때 중요합니다.