FrontierMathの記事一覧 | まだ人間です

2026-07-19 ・ The Decoder

Kimi K3とは？中国Moonshotの新AIがコード生成でClaude Fable 5を抜いた意味を解説

中国Moonshotのモデル「Kimi K3」が、人間の好み評価で順位を決める「Code Arena: Frontend」で1,679点を記録し、Claude Fable 5（1,631点）やGPT-5.6 Sol（1,618点）を上回って中国モデルとして初の首位に立ちました。一方でEpoch AIによれば、最難関の数学ベンチマークFrontierMath Tier 4では約39%にとどまり、90%近くに達する欧米勢に大きく水をあけられています。

#Kimi K3 #Moonshot #Claude Fable 5 #Code Arena

2026-06-13 ・ The Decoder

FrontierMathとは？Claude Fable 5がGPT-5.5を13ポイント差で抜いた意味を解説

AnthropicのClaude Fable 5が、最難関とされる数学ベンチマーク「FrontierMath」のティア4(v2)で88%を記録し、約75%のOpenAI GPT-5.5を13ポイント上回りました。半年前まで10%未満だった同系統モデルからの跳躍であり、AIの「研究レベルの数学推論」が実用射程に入りつつあることを示しています。

#Claude Fable 5 #FrontierMath #Anthropic #GPT-5.5

#FrontierMath の記事一覧（2）

Kimi K3とは？中国Moonshotの新AIがコード生成でClaude Fable 5を抜いた意味を解説

FrontierMathとは？Claude Fable 5がGPT-5.5を13ポイント差で抜いた意味を解説