Gemini 有哪些版本？Flash、Pro、Omni、Flash-Lite 一次搞懂

很多人第一次接触 Gemini，会被一排名字搞糊涂：Gemini Flash、Gemini Pro、Flash-Lite、Omni，后面还拖着 2.5、3.5 这些数字。到底哪个是哪个？

先讲结论：Gemini 是一整个模型家族，Google 把不同需求拆成好几条产品线，每条各司其职。想认识 Gemini 背后这家公司，可以先看 Google 是什么公司；这篇只专心做一件事，把这个家族拆给你看。

一句话定调：Google 用「同一个世代、分成好几种尺寸」的方式做模型，就像同一款车分省油版、性能版和入门版，你按需求挑就好。

Gemini 是一个家族，不是一个模型

理解 Gemini 命名的诀窍，是把它拆成两层。

第一层是产品线，也就是 Flash、Pro、Flash-Lite、Omni 这些名字，它们代表这个模型「为什么任务而生」。第二层是世代版本号，像 2.5、3.5，数字越新，通常代表训练数据更新、能力更强。所以「Gemini 3.5 Flash」的意思，就是「第 3.5 代的 Flash 线」。

记住这个拆法，以后不管 Google 推出 4.0 还是 5.0，你都能一眼看懂它在讲哪条线。

四条产品线各站哪里

把目前的主线摊开来看，分工大致是这样：

产品线	定位	适合的场景
Pro	最强推理 + 最长上下文	复杂推理、读长文档、写程序、需要「想清楚再答」的硬任务
Flash	速度与性价比的主力	量大、要实时响应、成本敏感的应用，例如聊天助手、客服、批量处理
Flash-Lite	家族里最便宜的一档	任务不难、但调用量超大、要把每次成本压到最低
Omni	音视频为主的全模态	图片、音频、视频的理解与生成，做多媒体内容

这四条线同时并存，Google 也会在同一个世代里一起更新它们。Flash 是多数人日常会碰到的主力，Pro 则是把难题交出去时的选择。

Gemini App 里切换模型线的菜单

要补一句：闭源商用的 Gemini 之外，Google 还维护一套叫 Gemma 的开放权重小模型，授权条款允许在一定范围内自由使用。本篇谈的是 Gemini 主线，Gemma 属于另一个故事。

Omni：往「全模态」再走一步

2026 年 5 月的 Google I/O 上，Omni 是最受瞩目的新成员。

过去的 Gemini 已经能读图、读视频、听音频，算是「看得懂」多媒体。Omni 想做的是再往前一步：同时吃图片、音频、视频、文字当输入，而且能直接吐出可以再编辑的视频。对想用 AI 做短视频、做素材的人来说，这是把生成能力补进来的一条新线。

要提醒的是，这类能力推进得很快，实际开放的范围与规格会一直变动，动手前最好先查当期官方说明。

你该挑哪一个

不必死记规格，用需求倒推最省事。

要的是实时、量大、成本可控，Flash 线是默认答案，多数产品级应用都从这里起跳。碰到要读很长的文档、要做复杂推理、要写比较硬的程序，就把任务交给 Pro 线，它思考得更深、上下文窗口更长。如果你的任务其实不难，但调用次数惊人，想把账单压到最低，Flash-Lite 就是为这种情况设计的。需要处理音视频、做生成式多媒体内容，再看 Omni。

如果你已经要动手对接 API，这篇给的是方向；真正要选版本、看每百万 token 报价，建议对照官方文档的当期型号。等小企鹅的 /ai/ 教学页上线，会带大家实际操作。

收费大概是什么概念

定价这件事最会过期，这里只给相对高低，不钉死数字。

消费端的 Gemini App 有免费额度，更强的模型与额度绑在 Google 的 AI 订阅方案里。开发者走 API 则是按用量计费，规则很直觉：越轻量的模型越便宜，Flash-Lite 最省、Flash 居中、Pro 最贵；长上下文与较新的世代通常单价较高。Google 另外提供批量模式，用延后交付换取明显的折扣。确切价格以官方定价页为准。

这个家族会往哪走

撇开个别版本号，Gemini 这几年的走向相当清楚。

模型线一边往更会思考走，能在回答前花更多算力推理，并让开发者自己设定「要它想多久」；一边往更长的上下文走，一次塞进整本文档、整个项目的数据；再来是往会自己动手的代理能力走，能串起多步骤的工作流；最后是往全模态走，把音视频的理解与生成一起包进来。

看懂这四个方向，比记住「现在旗舰是哪一版」有用得多。版本号每隔几个月就换，但这条演进主轴相对稳定。

小企鹅的提醒

AI 模型现在的更新速度，会让任何「最新版」很快变旧版。真正值得记住的是这个家族的分层逻辑，要快选 Flash、要强选 Pro、要省选 Flash-Lite、要玩音视频看 Omni。理解了这套分工，下次 Google 再丢出新世代，你只要问一句「这是哪条线的新版」，就没问题了。

延伸阅读：Google 是什么公司、Gemini 和 ChatGPT 谁用的人多。

FAQ

Gemini 到底有几种版本？

可以先记四条主线：Flash（速度与性价比）、Pro（最强推理与最长上下文）、Flash-Lite（最低成本）、Omni（音视频为主的全模态）。每条线底下还会挂不同的世代版本号，例如 2.5、3.5，数字越新通常代表能力越强。

Flash 和 Pro 差在哪？

Flash 走快与便宜，适合量大、要实时响应的场景；Pro 走深思考与长上下文，适合复杂推理、读长文档、写程序这类吃脑力的任务。同一世代里，Pro 通常比 Flash 贵、也比较慢，但答得更稳。

Gemini Omni 是什么？

Omni 是 Gemini 在 2026 年 I/O 推出的全模态家族，主打同时吃图片、音频、视频、文字当输入，并且能输出可编辑的视频。它把 Gemini 从「读懂多媒体」往「生成与编辑多媒体」再推一步。

Gemini 收费吗、大概多少？

消费端的 Gemini App 有免费版，进阶能力绑在 Google AI 订阅方案里；开发者走 API 则按用量计费，越轻量的模型越便宜。实际单价请以官方页面为准，这篇只给相对高低，不钉死数字。

我该选哪一个？

用需求倒推最快：要实时、要量大就挑 Flash 线；要读长文档、要最强推理就挑 Pro 线；想把成本压到最低、任务又不难就用 Flash-Lite；要处理音视频、做生成式内容就看 Omni。真的要动手对接，建议再对照官方文档的当期版本。