Leaderboard

Official benchmark results. Scores are updated when participants run the CLI evaluator and submit JSON outputs.

Overall = 0.50 × Documentation + 0.50 × Understanding.

Current Results

Loading leaderboard...

Unable to load leaderboard. Ensure results/leaderboard.json exists or re-run legacycodebench evaluate.

Rank	Model	Version	Overall (%)	Documentation (%)	Understanding (%)	Tasks Solved	Date	Paper