多くの人が初めて Gemini に触れると、ずらりと並んだ名前に戸惑います。Gemini Flash、Gemini Pro、Flash-Lite、Omni、そのうしろには 2.5、3.5 といった数字まで続いています。いったいどれがどれなのでしょう。
先に結論を言います。Gemini はまるごと一つのモデルファミリーで、Google は異なるニーズをいくつもの製品ラインに分け、それぞれに役割を持たせています。Gemini の背後にあるこの会社を知りたい方は、まず Google はどんな会社か をご覧ください。この記事はただ一つのこと、つまりこのファミリーを分解してお見せすることに専念します。
一言で枠組みを決めるなら、Google は「同じ世代を、いくつかのサイズに分ける」やり方でモデルを作っています。同じ車種に低燃費版・高性能版・エントリー版があるようなもので、必要に応じて選べばよいのです。
Gemini は一つのモデルではなく、一つのファミリー
Gemini の命名を理解するコツは、それを二つの層に分けることです。
第一の層は製品ライン、つまり Flash・Pro・Flash-Lite・Omni といった名前で、これはそのモデルが「何のタスクのために生まれたか」を表します。第二の層は世代番号で、2.5 や 3.5 のように、数字が新しいほど通常は訓練データが新しく、能力が高くなります。ですから「Gemini 3.5 Flash」とは、「第 3.5 世代の Flash ライン」という意味です。
この分け方を覚えておけば、Google が 4.0 を出そうと 5.0 を出そうと、どのラインの話なのか一目で分かります。
四つの製品ラインはそれぞれどこに立つか
現在の主軸を並べてみると、役割分担はおおよそ次のようになります。
| 製品ライン | 位置づけ | 向いている場面 |
|---|---|---|
| Pro | 最強の推論 + 最長のコンテキスト | 複雑な推論、長い文書の読み込み、プログラミングなど、「よく考えてから答える」必要のある難タスク |
| Flash | 速度とコスパの主力 | 量が多く、リアルタイム応答が必要で、コストに敏感な用途。たとえばチャットアシスタント、カスタマーサポート、バッチ処理 |
| Flash-Lite | ファミリー内で最も安い一枠 | タスクは難しくないが、呼び出し量が極めて多く、一回あたりのコストを極限まで下げたい場合 |
| Omni | 音声・動画中心のフルモーダル | 画像・音声・動画の理解と生成、マルチメディアコンテンツの制作 |
この四つのラインは同時に並存し、Google は同じ世代の中でまとめて更新することもあります。Flash は多くの人が日常で触れる主力であり、Pro は難題を任せるときの選択肢です。

一つ付け加えると、クローズドソースで商用の Gemini のほかに、Google は Gemma という、一定の範囲で自由に使えるライセンス条項を持つオープンウェイトの小型モデルも維持しています。本記事が扱うのは Gemini の主軸であり、Gemma はまた別の話です。
Omni:「フルモーダル」へもう一歩
2026 年 5 月の Google I/O で、Omni は最も注目を集めた新メンバーでした。
これまでの Gemini も、すでに画像を読み、動画を読み、音声を聞くことができ、マルチメディアを「理解できる」と言えました。Omni がやろうとしているのは、さらにもう一歩進むことです。画像・音声・動画・テキストを同時に入力として受け取り、しかも、あとから編集できる動画をそのまま出力できます。AI でショート動画や素材を作りたい人にとって、これは生成能力を補い入れる新たなラインです。
注意しておきたいのは、この種の能力は非常に速く進化しており、実際に公開される範囲や仕様は常に変動するということです。手を動かす前に、当期の公式説明を確認するのがよいでしょう。
あなたはどれを選ぶべきか
スペックを丸暗記する必要はありません。ニーズから逆算するのが一番手間のかからない道です。
求めているのがリアルタイム・大量・コスト管理可能なら、Flash ラインが既定の答えで、ほとんどのプロダクトレベルの用途はここから出発します。とても長い文書を読みたい、複雑な推論をしたい、より硬いプログラムを書きたいといった場面に出くわしたら、タスクを Pro ラインに任せましょう。より深く考え、コンテキストウィンドウもより長いのです。タスク自体は難しくないのに呼び出し回数が驚くほど多く、請求額を極限まで抑えたいなら、Flash-Lite がまさにこの状況のために設計されています。音声・動画を扱う、生成系のマルチメディアコンテンツを作る必要があるなら、Omni を見てください。
すでに API を組もうとしているなら、この記事はその方向性を示すものです。実際にバージョンを選び、百万トークンあたりの見積もりを見るときは、公式ドキュメントの当期モデルを併せて確認することをおすすめします。小企鵝の /ai/ チュートリアルページが公開されたら、実際の操作を一緒にご案内します。
料金はだいたいどんなイメージか
価格というものは最も陳腐化しやすいので、ここでは相対的な高低だけを示し、数字を固定しません。
コンシューマー向けの Gemini アプリには無料枠があり、より強力なモデルとより大きな枠は Google の AI サブスクリプションプランに組み込まれています。開発者が API を使う場合は従量課金で、ルールはとても直感的です。軽いモデルほど安く、Flash-Lite が最も経済的、Flash が中間、Pro が最も高価で、長いコンテキストや新しい世代は通常、単価が高めになります。Google はそのほかにバッチモードも提供しており、納品を遅らせる代わりに目に見える割引が得られます。正確な価格は 公式価格ページ をご確認ください。
このファミリーはどこへ向かうか
個別のバージョン番号を脇に置けば、ここ数年の Gemini の方向性はかなり明確です。
モデルラインは、一方ではより上手に考える方向へ進みます。答える前により多くの計算資源を推論に費やせるようになり、開発者自身が「どれくらい考えさせるか」を設定できるようになります。もう一方ではより長いコンテキストへ進み、一度に文書一冊、プロジェクト一つ分のデータを詰め込めるようになります。さらに自ら手を動かすエージェント能力へ進み、複数ステップのワークフローをつなげられるようになります。そして最後にフルモーダルへ進み、音声・動画の理解と生成をまとめて取り込みます。
この四つの方向を理解することは、「今の旗艦はどのバージョンか」を覚えるよりもはるかに役に立ちます。バージョン番号は数か月ごとに入れ替わりますが、この進化の主軸は比較的安定しています。
小企鵝からのひとこと
いまの AI モデルの更新スピードは、どんな「最新版」もあっという間に旧版にしてしまいます。本当に覚えておく価値があるのは、このファミリーの階層のロジックです。速さなら Flash、強さなら Pro、節約なら Flash-Lite、音声・動画なら Omni。この役割分担を理解すれば、次に Google が新しい世代を投げてきたとき、「これはどのラインの新版か」と一言問うだけで、もう大丈夫です。