何が起きたか

Pramaana Labsは水曜、Khosla Venturesがリードする27百万ドルのシードラウンドを発表しました。Accel、BoldCap、Nexus Venture Partners、Premji Invest、Unboundも参加しています。

同社のアプローチは、一般的なLLMの上に「決定論的な検証レイヤー」を載せるというものです。検証層には、数学的証明の正しさを機械的に検証するために使われてきたオープンソース言語LEANを採用。各業務領域ごとに、その分野のルールをLEAN形式で記述し、ドメイン専門家が監修します。税法では元IRS長官のDanny Werfel氏、サイバーセキュリティと創薬ではIIT Delhi、IIT Madras、UC Berkeleyの教授陣が関わっています。

なぜ「形式検証×LLM」なのか

創業者Ranjan Rajagopalan氏は「世界で最も難しい問題は解けないのではなく、形式化されていないだけだ」と語ります。先行事例として参照しているのは、フランス政府が税制・社会保障制度の大部分を実行可能なコードに落とし込んだCATALAプロジェクトです。

ポイントは、LLMの「もっともらしいが間違うことがある」出力を、ルールベースの検証で機械的に弾く構造にある点です。法律・税務・創薬は「ルールが大量にあり、間違いが健康・金銭・自由のコストに直結する」領域で、まさに形式化の効きどころ。Rajagopalan氏自身、「これは数学に似ている——守るべきルールが大量にある」「いったんコード化してしまえば、その上での推論は決定論的になり始める」と述べています。

ここが論点

本質的な賭けは、対象ドメインのルールをどこまで漏れなくLEANで記述できるか、そしてその記述を専門家コミュニティが維持できるかにあります。CATALAが示したように国家規模で可能ではあるものの、コストは小さくありません。

💼 事業会社視点:これは自社にどう効くか

日本企業にとって、このニュースは「LLMをミッションクリティカル業務にどう載せるか」という積年の宿題への一つの答え方を示します。

特に効くのは、税理士法人・法律事務所・製薬R&Dを顧客に持つSaaSと、規制対応の受託開発を抱えるSIerです。これらの領域では、汎用LLMの「9割正解」では業務に使えず、結果として日本ではPoC止まりの案件が大量に滞留しています。Pramaanaの「LLM+形式検証層」アーキテクチャは、自社プロダクトでも模倣可能なパターンです。

事業責任者が今すぐ動くべきは2点。第一に、自社が扱う業務ルール(社内規程、業界規制、契約テンプレ)を「自然言語の慣習」から「機械可読なルール集」に書き換える投資を始めること。これはAI以前の知的資産の棚卸しに近く、LLMの精度競争とは別軸の堀になります。第二に、ドメイン専門家を「監修者」ではなく「ルール記述者」として処遇する組織設計です。法務・税務・薬事の人材がコードに近い記述を担う体制こそ、形式検証型AIの実装力を決めます。

関連リンク