AI2 Reasoning Challenge (ARC)

Scores Over Time

Individual benchmark scores plotted by date.

AI2 Reasoning Challenge (ARC) - Benchmark Leaderboard & Model Performance | AI Stats

Organisation	Model	Reported	Top Score	Info	Self Reported	Source
OpenAI	GPT 4 32K 0613	13 Jun 2023	0.96	inferred high-confidence family alias from gpt-4-0613 (score=0.4899; benches=12)	Yes	Source