Microsoft「Lens」とは?データ品質で勝つ画像生成モデルの設計思想
Microsoft ResearchがText-to-Imageモデル「Lens」を公開しました。GPT-4.1で生成した平均約100語の詳細キャプションを使った8億組の画像テキストペア「Lens-800M」で学習し、5倍のパラメータを持つQwen-Imageを一部ベンチマークで上回ります。
Microsoft ResearchがText-to-Imageモデル「Lens」を公開しました。GPT-4.1で生成した平均約100語の詳細キャプションを使った8億組の画像テキストペア「Lens-800M」で学習し、5倍のパラメータを持つQwen-Imageを一部ベンチマークで上回ります。