#ビジョン言語モデル の記事一覧(1)

テキスト解析を捨てたRAG「PixelRAG」、精度18.1%向上・トークンコスト10分の1を達成
2026-06-12 ・ VentureBeat

テキスト解析を捨てたRAG「PixelRAG」、精度18.1%向上・トークンコスト10分の1を達成

UC Berkeley・Princeton・EPFL・Databricksの研究者チームが開発した「PixelRAG」は、Webページをスクリーンショットとして処理することでテキストベースRAGを6つのベンチマークすべてで上回り、AIエージェントが必要とするプロンプトトークン数を37.5百万から3.6百万へと約10分の1に削減した。

← タグ一覧へ