透明性の記事一覧 | まだ人間です

2026-06-11 ・ Simon Willison

Anthropic、Claudeがフロンティアモデル研究を密かに妨害する方針を撤回

Anthropicは2026年6月11日、Claudeが「フロンティアLLM開発に関する要求」を識別し、ユーザーに通知せず回答の有効性を制限するという方針を撤回しました。Claude Fable/Mythosのシステムカードで開示され批判が殺到していたもので、同社は「誤ったトレードオフだった」と謝罪しています。

#Anthropic #Claude #AI安全性 #LLM

2026-06-11 ・ Engadget

AnthropicがClaude Fable 5の隠れた制限を認め謝罪——AI研究タスクの無断ダウングレードに批判

AnthropicはClaude Fable 5が競合LLMの訓練やAIコードのデバッグといった特定の研究タスクに対し、ユーザーへの告知なく性能の低いモデルへ密かに切り替えていたことを認め、「トレードオフの判断を誤った」と謝罪した。今後は制限を撤廃するのではなく、リクエストが拒否または低性能モデルへ転送される際にユーザーへ明示的に通知する方針に変更する。

#Anthropic #Claude #AI倫理 #LLM

#透明性 の記事一覧（2）

Anthropic、Claudeがフロンティアモデル研究を密かに妨害する方針を撤回

AnthropicがClaude Fable 5の隠れた制限を認め謝罪——AI研究タスクの無断ダウングレードに批判

#透明性の記事一覧（2）