In the Weightsとは？LLMの「記憶」を可視化するサイトの仕組みと事業活用

In the Weightsは、大規模言語モデルの重みに特定の人物が「記憶」されているかを可視化するサイトです。複数モデルへの問い合わせ結果を統合し、最大996のstrength scoreで重要度を数値化します。

何が起きたか

In the Weightsという新サイトが公開され、大規模言語モデル(LLM)の重みに「誰が記憶されているか」を判定できるようになりました。LLMは数十億の数値で知識をエンコードしており、ある人物が重みに含まれていれば、モデルはWeb検索などの外部ツールなしにその人物を想起できることを意味します。

サイトは複数のモデルに「この人物は誰か」を問い合わせ、その応答を統合してstrength scoreを算出します。最大値は996。例えばMozartやShakespeareは高スコア、Taylor Swiftで262、Joey FlynnやThomas Dimsonでは175といった具合に、人物ごとの「モデル内での存在感」が数値で示されます。

なぜ重要か

注目すべきは、Metaが公開する10億パラメータのLlamaのような小型モデルにも名前が残っているかどうかです。小さなモデルに含まれているということは、学習データの中で「圧縮しても捨てられなかった」関連性の高い人物だと判定されたことを示します。逆に大型モデルにしか入っていない人物は、相対的にニッチな扱いと解釈できます。

限界と注意点

運営側もLLM特有の限界を認めています。伝記情報のハルシネーション、入力のtypoによるスコア低下、同名異人が多い「common names」では精度が落ちる、といった問題です。スコアは絶対的な著名度ではなく、あくまで「特定モデル群が学習時にどう扱ったか」のスナップショットとして読む必要があります。

💼 事業会社視点：これは自社にどう効くか

このツールが日本の事業会社に突きつけるのは「自社・自社製品・経営者の名前は、LLMに記憶されているか」という新しいSEOならぬLEO(LLM最適化)の問いです。BtoB SaaSや受託開発企業の経営者にとって、自社サービスや自分の名前がLlamaのような小型モデルにすら定着していれば、ChatGPTやClaude経由のリード流入で「検索ツールを呼ばずに」推奨される可能性が高まります。

ECや消費者向けブランドであれば、自社商品名のstrength scoreを競合と比較することで、生成AI時代のブランド露出量を定量化する初手になり得ます。広報・PR部門の評価指標を、被リンク数やPV中心から「主要モデルへの記憶定着度」へ拡張する議論を、役員レベルで始める価値があります。

一方で、スコアが低くてもRAGや検索連携で十分カバー可能です。経営者が今動くべきは、自社の重要キーワードでIn the Weightsを試し、「重みに入る戦略」と「検索拡張で補う戦略」のどちらに投資配分するかを判断することです。

よくある質問

strength scoreはどのように算出されますか?

In the Weightsは複数のモデルに「この人物は誰か」を問い合わせ、その回答を統合してスコア化します。最大値は996で、例えばTaylor Swiftは262、Joey FlynnやThomas Dimsonは175といった値が示されます。

小型モデルに名前があると何が分かりますか?

Metaの10億パラメータのLlamaのような小さなモデルにも記憶されている場合、学習時に「圧縮しても残すべき」と判断された関連性の高い人物だと考えられます。大型モデルにしか入っていない場合よりも、相対的に重要度が高いと解釈できます。

スコアの信頼性に注意点はありますか?

運営側は、伝記情報のハルシネーション、入力のtypoによるスコア低下、同名異人が多いcommon namesでの精度劣化を限界として明示しています。スコアは特定モデル群の学習結果のスナップショットとして読む必要があります。

本記事は The Decoder の報道を元に、事実に基づき独自に再構成したものです。

In the Weightsとは？LLMの「記憶」を可視化するサイトの仕組みと事業活用

何が起きたか

なぜ重要か

限界と注意点

💼 事業会社視点：これは自社にどう効くか

関連リンク

よくある質問

関連記事

In the Weightsとは？AIモデルの「記憶」を可視化するエゴサーチツールを解説

テキスト解析を捨てたRAG「PixelRAG」、精度18.1%向上・トークンコスト10分の1を達成

Claude Fable 5、ベンチマーク首位も性能向上5.7%でコストは2倍——費用対効果に課題