わずか約22万円で1Bパラメータモデルを訓練——Sapient IntelligenceのHRM-Textが示す低コストAI開発の可能性

Sapient Intelligenceは、Transformer非依存のHierarchical Recurrent Model（HRM）アーキテクチャを採用した10億パラメータの基盤モデル「HRM-Text」を、約1,500ドル（約22万円）の計算コストで訓練したと発表した。16基のGPUを使い1.9日で完成したこのモデルは、Qwen・Gemma・Llamaといった同規模モデルに比べ、最大900分の1のトークン数・最大432分の1の計算量で同等水準のベンチマーク性能を達成している。

何が起きたか

Sapient Intelligenceの研究者チームは、「HRM-Text」と名付けた10億パラメータの基盤言語モデルを公開した。訓練に使ったのは400億トークンの指示応答ペアで、16基のGPUで1.9日間という短期間に完了。総訓練コストは1,500ドルにとどまった。モデルの詳細はarXivで公開されている。

Transformerを使わないアーキテクチャ

HRM-Textの核心は、標準的なTransformerを使わない「Hierarchical Recurrent Model（HRM）」アーキテクチャにある。HRMは計算を2層に分離する設計で、意味的文脈を扱う「H-module（低速層）」と局所的な表現を精緻化する「L-module（高速層）」が役割分担する。同社のGuan Wangは「言語には高速な局所精緻化と低速な意味安定性の両方が必要だ」と説明している。

HRMの概念自体は2025年に発表済みだが、今回はこれを自然言語タスクに適用した初の実装となる。

訓練方法の工夫

訓練には次トークン予測ではなく、指示応答ペアを使ったタスク完了目的関数を採用した。「人がモデルを実際に使うときは、指示を与えて有用な応答を期待する。訓練もそこから直接始めた」（Guan Wang）。

リカレント構造特有の勾配消失・爆発を防ぐため、「MagicNorm」と呼ぶ正規化手法とウォームアップ訓練手法を新たに導入している。

ベンチマーク性能

公開されたベンチマーク結果は以下のとおり。

MMLU：60.7%
GSM8K：84.5%
MATH：56.2%
DROP：81.1%（ゼロコンタミネーション条件）

これらはQwen・Gemma・Llamaの2〜7Bパラメータモデルと比較可能な水準とされており、使用した訓練トークン数は同等モデルの100分の1〜900分の1、計算量は96分の1〜432分の1だという。DROP（文書読解・数値推論）でのゼロコンタミネーション評価は、ベンチマーク答え暗記への懸念に対応するものとして同社は強調する。

エンタープライズへの含意

Wangは「訓練コストが1,500ドルまで下がると、AIはインフラの問題から戦略の問題に変わる」と述べる。特に、機密データを外部のフロンティアモデルに送れない企業や、汎用大規模モデルを必要としない用途において、小型でタスク特化した推論モデルの選択肢が広がると同社は主張する。

現状と利用方法

HRM-Textはtransformers >= 5.9.0のTransformersライブラリにネイティブ対応しており、vLLMおよびSGLangへの対応も開発中。Wangは「まだプラグアンドプレイのChatGPT代替ではなく、コンパクトな基盤言語推論モデルだ」と現状の位置づけを明確にしている。

出典：VentureBeat

よくある質問

HRM-TextはChatGPTやGPT-4の代替として使えますか？

Guan Wang自身が「まだプラグアンドプレイのChatGPT代替ではない」と明言しており、汎用対話AIではなくコンパクトな基盤言語推論モデルとして設計されています。

なぜこれほどコストを抑えられたのですか？

次トークン予測ではなく指示応答ペアによるタスク完了目的で訓練したこと、HRMアーキテクチャにより同規模モデル比で最大900分の1のトークン・432分の1の計算量で収まったことが主な要因です。

既存のAI開発環境でHRM-Textを使えますか？

Transformersライブラリ（バージョン5.9.0以上）に対応しており、すぐに利用可能です。vLLMおよびSGLangへの対応は現在開発中です。

本記事は VentureBeat の報道を元に、事実に基づき独自に再構成したものです。

わずか約22万円で1Bパラメータモデルを訓練——Sapient IntelligenceのHRM-Textが示す低コストAI開発の可能性

何が起きたか

Transformerを使わないアーキテクチャ

訓練方法の工夫

ベンチマーク性能

エンタープライズへの含意

現状と利用方法

関連リンク

よくある質問

関連記事

LLMは「人間らしい」のか？Age of Empires IIにニューラルネットを作った研究者が突きつける問い

MetaのForum・Sellerとは？LLMで「アプリ量産」に舵を切ったMetaの狙いを解説

Opus 5とは？「性能の飛躍」より「半額」を選んだAnthropicの狙いを解説