Benchmark Detail

Aider Polyglot

파일 편집: 터미널 pair programming, 기존 코드 수정, PR 단위 변경

공식 리더보드 보기 코드를 새로 쓰는 능력보다 ‘이미 있는 코드를 제대로 고치는지’를 볼 때 유용합니다.

점수 그래프

왼쪽부터 높은 순서
아직 공개 점수를 연결하지 않았습니다. 점수가 확인되는 모델만 추가할 예정입니다.

여러 프로그래밍 언어에서 기존 파일을 직접 수정하는 능력을 봅니다.

코드를 새로 쓰는 능력보다 ‘이미 있는 코드를 제대로 고치는지’를 볼 때 유용합니다.