Library/bigcode-evaluation-harnessForked

bigcode-project/bigcode-evaluation-harness

bigcode-evaluation-harness

A framework for the evaluation of autoregressive code generation language models.

View on GitHub↗Upstream bigcode-project/bigcode-evaluation-harness↗

Builder

bigcode-project

bigcode-project • individual

Stars

1,047

Using upstream star count

Forks

263

Using upstream fork count

Open Issues

Activity Score

0/100

0 commits in 30d

Created

Aug 9, 2022

Project creation date

README Summary

<h1 align="center">Code Generation LM Evaluation Harness</h1>

Community Evaluation

Loading…

AI Dev Skills

Unmapped

Autoregressive Language ModelingCode CompletionCode Generation EvaluationFew-shot LearningLarge Language Model EvaluationModel BenchmarkingNatural Language to Code TranslationProgram Synthesis

Taxonomy

AI Trends

Large Language Models Code Generation AI AI-Assisted Programming Model Evaluation Standards

Recent Activity

Updated 10 months ago

7 Days

30 Days

90 Days

Quality

research

Quality: high
Maturity: research

PM Skills

Scale & ReliabilityData & Evaluation

Languages

Python100.0%

Timeline

Project created: Aug 9, 2022
Forked: Mar 22, 2026
Your last push: 10 months ago
Upstream last push: 10 months ago
Tracked since: Jul 22, 2025

Similar Repos

pgvector cosine similarity · $0

Loading…

Library/bigcode-evaluation-harnessForked

bigcode-project/bigcode-evaluation-harness

bigcode-evaluation-harness

A framework for the evaluation of autoregressive code generation language models.

View on GitHub↗Upstream bigcode-project/bigcode-evaluation-harness↗

Builder

bigcode-project

bigcode-project • individual

Stars

1,047

Using upstream star count

Forks

263

Using upstream fork count

Open Issues

Activity Score

0/100

0 commits in 30d

Created

Aug 9, 2022

Project creation date

README Summary

<h1 align="center">Code Generation LM Evaluation Harness</h1>

Community Evaluation

Loading…

AI Dev Skills

Unmapped

Autoregressive Language ModelingCode CompletionCode Generation EvaluationFew-shot LearningLarge Language Model EvaluationModel BenchmarkingNatural Language to Code TranslationProgram Synthesis

Taxonomy

AI Trends

Large Language Models Code Generation AI AI-Assisted Programming Model Evaluation Standards

Recent Activity

Updated 10 months ago

7 Days

30 Days

90 Days

Quality

research

Quality: high
Maturity: research

PM Skills

Scale & ReliabilityData & Evaluation

Languages

Python100.0%

Timeline

Project created: Aug 9, 2022
Forked: Mar 22, 2026
Your last push: 10 months ago
Upstream last push: 10 months ago
Tracked since: Jul 22, 2025

Similar Repos

pgvector cosine similarity · $0

Loading…

bigcode-evaluation-harness

README Summary

Community Evaluation

AI Dev Skills

Tags

Taxonomy

Recent Activity

Quality

Categories

PM Skills

Languages

Timeline

Similar Repos

bigcode-evaluation-harness

README Summary

Community Evaluation

AI Dev Skills

Tags

Taxonomy

Recent Activity

Quality

Categories

PM Skills

Languages

Timeline

Similar Repos