TAU3-Bench

91.40% - Mistral Medium 3.5

TAU3-Bench - Benchmark Leaderboard & Model Performance | Phaseo

Organisation	Model	Reported	Top Score	Info	Self Reported	Source
Mistral	Mistral Medium 3.5	29 Apr 2026	91.40%	Telecom	Yes	Source
Qwen	Qwen 3.6 Plus	01 Apr 2026	70.70%	-	Yes	Source
Sakana AI	Fugu	22 Jun 2026	21.70%	Sakana reports this benchmark as Tau3 Banking.	Yes	Source
Sakana AI	Fugu Ultra	22 Jun 2026	20.60%	Sakana reports this benchmark as Tau3 Banking.	Yes	Source