Claude Fable 5の「過剰な能動性」とは?CSSバグ1件にブラウザ自動化を自作した実例から読む
Simon Willison氏がDatasette AgentのCSSスクロールバー不具合の調査をClaude Fable 5に依頼したところ、Pythonの自作CORSサーバ起動、Safari/Firefoxの画面キャプチャ、テンプレートへのJS注入まで自走し、最終的に2行のCSS修正に至りました。セッションコストは約12.11ドル、出力トークンは68606に達しています。
Simon Willison氏がDatasette AgentのCSSスクロールバー不具合の調査をClaude Fable 5に依頼したところ、Pythonの自作CORSサーバ起動、Safari/Firefoxの画面キャプチャ、テンプレートへのJS注入まで自走し、最終的に2行のCSS修正に至りました。セッションコストは約12.11ドル、出力トークンは68606に達しています。
Coinbase共同創業者のBrian Armstrongが「12〜18カ月以内に80%のワークロードが99%安価なモデルへ移る」とX上で予測。法務AIのHarveyはFireworks AIと組み、Claude OpusとGLM 5.1を使い分けることで推論コストを3分の1に削減した実例を示しました。