ニュース

超高速にコーディング・文章生成 Googleが「Gemini Diffusion」

Google DeepMindは21日、Google I/Oにて新たな研究モデルとなる「Gemini Diffusion」を発表した。圧倒的に高速に、文章やコードを生成できる新たなモデルとなり、ウェイトリストの登録を開始している。

Gemini Diffusionは、画像生成や動画生成に使われる拡散(Diffusion)モデルを文章やコード生成に応用したもの。従来の自己回帰型言語モデルは、テキストを1単語(トークン)ずつ生成するため、プロセスは遅く、出力の品質や一貫性を制限する可能性もある。拡散モデルでは、テキストを直接予測するのではなく、ノイズを段階的に精緻化することで出力を生成。これにより、解決策を高速に反復し、生成プロセス中にエラーを修正するため、高速なだけでなく一貫性に優れ、特に数学やコードを含む編集タスクにおいて優れているという。

Gemini Diffusionの実験用デモでは、Googleの最速モデルとの比較において、コンテンツを生成する速度を大幅に高速化しながら、コーディング性能は同等レベルとしている。

同社が公開したベンチマークでは、Gemini 2.0 Flash Lite相当の性能を持ちながら、毎秒1,479トークン(約1,500の単語)を生成できるという。

Gemini Diffisionは、ウェイトリストの登録を開始している。また、すべてのGeminiモデルにおいて、遅延低減に向けた研究を進めており、近日中に2.5 Flash Liteの高速化版をリリース予定としている。