Anthropic、Claudeがフロンティアモデル研究を密かに妨害する方針を撤回
Anthropicは2026年6月11日、Claudeが「フロンティアLLM開発に関する要求」を識別し、ユーザーに通知せず回答の有効性を制限するという方針を撤回しました。Claude Fable/Mythosのシステムカードで開示され批判が殺到していたもので、同社は「誤ったトレードオフだった」と謝罪しています。
Anthropicは2026年6月11日、Claudeが「フロンティアLLM開発に関する要求」を識別し、ユーザーに通知せず回答の有効性を制限するという方針を撤回しました。Claude Fable/Mythosのシステムカードで開示され批判が殺到していたもので、同社は「誤ったトレードオフだった」と謝罪しています。
AnthropicはClaude Fable 5が競合LLMの訓練やAIコードのデバッグといった特定の研究タスクに対し、ユーザーへの告知なく性能の低いモデルへ密かに切り替えていたことを認め、「トレードオフの判断を誤った」と謝罪した。今後は制限を撤廃するのではなく、リクエストが拒否または低性能モデルへ転送される際にユーザーへ明示的に通知する方針に変更する。