何が起きたか
In the Weightsという新サイトが公開され、大規模言語モデル(LLM)の重みに「誰が記憶されているか」を判定できるようになりました。LLMは数十億の数値で知識をエンコードしており、ある人物が重みに含まれていれば、モデルはWeb検索などの外部ツールなしにその人物を想起できることを意味します。
サイトは複数のモデルに「この人物は誰か」を問い合わせ、その応答を統合してstrength scoreを算出します。最大値は996。例えばMozartやShakespeareは高スコア、Taylor Swiftで262、Joey FlynnやThomas Dimsonでは175といった具合に、人物ごとの「モデル内での存在感」が数値で示されます。
なぜ重要か
注目すべきは、Metaが公開する10億パラメータのLlamaのような小型モデルにも名前が残っているかどうかです。小さなモデルに含まれているということは、学習データの中で「圧縮しても捨てられなかった」関連性の高い人物だと判定されたことを示します。逆に大型モデルにしか入っていない人物は、相対的にニッチな扱いと解釈できます。
限界と注意点
運営側もLLM特有の限界を認めています。伝記情報のハルシネーション、入力のtypoによるスコア低下、同名異人が多い「common names」では精度が落ちる、といった問題です。スコアは絶対的な著名度ではなく、あくまで「特定モデル群が学習時にどう扱ったか」のスナップショットとして読む必要があります。
💼 事業会社視点:これは自社にどう効くか
このツールが日本の事業会社に突きつけるのは「自社・自社製品・経営者の名前は、LLMに記憶されているか」という新しいSEOならぬLEO(LLM最適化)の問いです。BtoB SaaSや受託開発企業の経営者にとって、自社サービスや自分の名前がLlamaのような小型モデルにすら定着していれば、ChatGPTやClaude経由のリード流入で「検索ツールを呼ばずに」推奨される可能性が高まります。
ECや消費者向けブランドであれば、自社商品名のstrength scoreを競合と比較することで、生成AI時代のブランド露出量を定量化する初手になり得ます。広報・PR部門の評価指標を、被リンク数やPV中心から「主要モデルへの記憶定着度」へ拡張する議論を、役員レベルで始める価値があります。
一方で、スコアが低くてもRAGや検索連携で十分カバー可能です。経営者が今動くべきは、自社の重要キーワードでIn the Weightsを試し、「重みに入る戦略」と「検索拡張で補う戦略」のどちらに投資配分するかを判断することです。