Library/simple-evalsForked

openai/simple-evals

simple-evals

**July 2025**: `simple-evals` will no longer be updated for new models or benchmark results. The repo will continue to host reference implementations

View on GitHub↗Upstream openai/simple-evals↗

Builder

OpenAI

openai • ai-lab

Stars

4,506

Using upstream star count

Forks

490

Using upstream fork count

Open Issues

Activity Score

0/100

0 commits in 30d

Created

Apr 11, 2024

Project creation date

README Summary

**July 2025**: `simple-evals` will no longer be updated for new models or benchmark results. The repo will continue to host reference implementations for **HealthBench**, **BrowseComp**, and **SimpleQA**.

Community Evaluation

Loading…

AI Dev Skills

Unmapped

AI TestingBenchmarkingModel EvaluationPerformance Assessment

Taxonomy

AI Trends

AI Safety Model Evaluation

Recent Activity

Updated 10 months ago

7 Days

30 Days

90 Days

Quality

prototype

Quality: medium
Maturity: prototype

PM Skills

Data & Evaluation

Languages

Python100.0%

Timeline

Project created: Apr 11, 2024
Forked: Mar 14, 2026
Your last push: 10 months ago
Upstream last push: 1 months ago
Tracked since: Jul 31, 2025

Similar Repos

pgvector cosine similarity · $0

Loading…

Library/simple-evalsForked

openai/simple-evals

simple-evals

**July 2025**: `simple-evals` will no longer be updated for new models or benchmark results. The repo will continue to host reference implementations

View on GitHub↗Upstream openai/simple-evals↗

Builder

OpenAI

openai • ai-lab

Stars

4,506

Using upstream star count

Forks

490

Using upstream fork count

Open Issues

Activity Score

0/100

0 commits in 30d

Created

Apr 11, 2024

Project creation date

README Summary

Community Evaluation

Loading…

AI Dev Skills

Unmapped

AI TestingBenchmarkingModel EvaluationPerformance Assessment

Taxonomy

AI Trends

AI Safety Model Evaluation

Recent Activity

Updated 10 months ago

7 Days

30 Days

90 Days

Quality

prototype

Quality: medium
Maturity: prototype

PM Skills

Data & Evaluation

Languages

Python100.0%

Timeline

Project created: Apr 11, 2024
Forked: Mar 14, 2026
Your last push: 10 months ago
Upstream last push: 1 months ago
Tracked since: Jul 31, 2025

Similar Repos

pgvector cosine similarity · $0

Loading…

simple-evals

README Summary

Community Evaluation

AI Dev Skills

Tags

Taxonomy

Recent Activity

Quality

Categories

PM Skills

Languages

Timeline

Similar Repos

simple-evals

README Summary

Community Evaluation

AI Dev Skills

Tags

Taxonomy

Recent Activity

Quality

Categories

PM Skills

Languages

Timeline

Similar Repos