何が起きたか
エストニア言語研究所が、AI言語モデルがロシア発のプロパガンダにどれだけ流されやすいかを定量化したベンチマークを公開しました。60モデルを対象に、3言語・75問・14種類のプロパガンダ・ナラティブを「中立」「偏向」「誘導的」の3パターンで投げかけ、回答を1〜5点で採点しています(1点はロシア側の主張をそのまま繰り返した状態)。評価者には較正済みのClaude Opus 4.5が用いられ、偽情報専門NGO Propastopが妥当性を検証しました。
ランキングの構図
首位はClaude Fable 5(95.2点、米国外では現在停止)、続いてClaude Opus 4.7。以下NvidiaのNemotron 3、AlibabaのQwen 3.6 Plusが上位に並びました。一方、フランスのMistralは新型のMedium 3.5を含めて下位3分の1に位置。これはNewsguardが別途算出したMistralの誤情報率36.67%とも整合する結果です。なお今回のテストはWeb検索やツール利用を遮断しており、純粋に「モデルそのものの耐性」を測っている点が重要です。
なぜ重要か
ロシア系ネットワーク「Pravda」などは、AIの学習データを汚染する目的で数百万件規模の偽情報記事を流し込むLLMグルーミングを組織的に行っています。OpenAIが先日、ドイツ連邦議会選挙を狙ってChatGPTを悪用しようとしたロシアのキャンペーンを遮断したのも同じ文脈です。つまりモデル選定は単なる精度比較ではなく、地政学リスクを直接取り込むかどうかの選択になりつつあります。Mistralが30億ユーロ・評価額200億ユーロの資金調達を進める「欧州の代替」という政治的ポジションと、耐性スコアの低さが噛み合っていない点も注目されます。
💼 事業会社視点:これは自社にどう効くか
日本企業の経営者・事業責任者への含意
生成AIを社内活用・顧客対応・調査業務に組み込む日本企業にとって、今回の結果は「モデル選定基準にバイアス耐性を入れる」契機になります。特に影響が大きいのは次の3層です。
1. メディア・調査会社・コンサル: AIに一次調査やリサーチ要約を任せる場合、出力に親ロシア的歪みが混入すれば、レポートそのものの信頼性が毀損します。今後はクライアントから「使用モデル名」の開示を求められる可能性があります。
2. SaaS・受託開発ベンダー: 「欧州産だから安心」という理由でMistralを採用してきた事業者は、調達基準を見直す必要があります。GDPR対応とバイアス耐性は別問題であり、両方を満たすかをモデル単位で再評価すべき局面です。
3. EC・カスタマーサポート: チャットボットが政治的話題に触れた瞬間にブランド毀損リスクが顕在化します。社内ガードレールだけでなく、ベースモデル自体の耐性を調達要件に組み込むのが現実解です。「マルチモデル運用+用途別の使い分け」を意思決定すべきタイミングです。