Benchmark Detail
Aider Polyglot
파일 편집: 터미널 pair programming, 기존 코드 수정, PR 단위 변경
공식 리더보드 보기
코드를 새로 쓰는 능력보다 ‘이미 있는 코드를 제대로 고치는지’를 볼 때 유용합니다.
점수 그래프
왼쪽부터 높은 순서아직 공개 점수를 연결하지 않았습니다. 점수가 확인되는 모델만 추가할 예정입니다.
읽는 법
전체 벤치마크여러 프로그래밍 언어에서 기존 파일을 직접 수정하는 능력을 봅니다.
코드를 새로 쓰는 능력보다 ‘이미 있는 코드를 제대로 고치는지’를 볼 때 유용합니다.