Benchmark Detail
BFCL
함수 호출: API 호출형 agent, 플러그인, 업무 자동화
공식 리더보드 보기
챗봇이 아니라 실제 서비스를 조작하는 AI를 만들 때 중요합니다.
점수 그래프
왼쪽부터 높은 순서아직 공개 점수를 연결하지 않았습니다. 점수가 확인되는 모델만 추가할 예정입니다.
읽는 법
전체 벤치마크Berkeley Function Calling Leaderboard. 함수 호출과 tool use 정확도를 봅니다.
챗봇이 아니라 실제 서비스를 조작하는 AI를 만들 때 중요합니다.