ニュース

Google、柔軟性と日本語向上のモバイルAI「Gemma 3n」

Googleは、スマートフォンやノートPCといったモバイルデバイス上で動作するオンデバイスAIのオープンモデル「Gemma 3n」を発表した。Google AI Studioなどを通じてプレビュー版の提供が開始されている。

「Gemma 3n」はクアルコムやMediTek、サムスンといったチップセットメーカーと協力して開発されており、モバイルデバイス上で動作し、パーソナルでプライベートなAIの利用が可能になる。

モバイルでの応答を高速化したほか、メモリ使用量を大幅に削減する技術(PLE)を採用しており、2GBのスペースで動作できる。ローカルで実行でき、インターネット接続がなくても機能する。マルチモーダルとしてオーディオ、テキスト、画像などに対応し、自動音声認識やリアルタイムの書き起こし、音声を翻訳テキストにするといった動作が可能になっている。

ベンチマークスコア

大きな特徴として、「ミックス&マッチ」機能が導入されたことも挙げられる。これは、基本を40億パラメータのモデルとしながら、入れ子式に、20億パラメータなどのサブモデルが含まれているというもので、40億パラメータモデルから動的に異なるサブモデルを作成できる。アプリケーションの要件に応じて、高速応答、あるいは高品質など、サブモデルを動的に切り替えられるほか、デバイスの性能に合わせた最適なモデルを選択できる。

Gemma 3nのミックス&マッチ(事前学習済み)機能における、ベンチマーク性能(MMLU)とモデルサイズの関係

このほか、従来は英語以外の性能に課題もあったが、今回のモデルは多言語対応を強化。特に日本語、ドイツ語、韓国語、スペイン語、フランス語の性能が向上している。

「Gemini」(ジェミニ)がGoogleの提供するサービスであるのに対し、「Gemma」(ジェマ)はGeminiと同じ研究や技術を基に開発され、オープンソースとして提供されるAIモデル。個人・商用利用、再配布が可能で、無料。