很多人第一次接触 Gemini,会被一排名字搞糊涂:Gemini Flash、Gemini Pro、Flash-Lite、Omni,后面还拖着 2.5、3.5 这些数字。到底哪个是哪个?
先讲结论:Gemini 是一整个模型家族,Google 把不同需求拆成好几条产品线,每条各司其职。想认识 Gemini 背后这家公司,可以先看 Google 是什么公司;这篇只专心做一件事,把这个家族拆给你看。
一句话定调:Google 用「同一个世代、分成好几种尺寸」的方式做模型,就像同一款车分省油版、性能版和入门版,你按需求挑就好。
Gemini 是一个家族,不是一个模型
理解 Gemini 命名的诀窍,是把它拆成两层。
第一层是产品线,也就是 Flash、Pro、Flash-Lite、Omni 这些名字,它们代表这个模型「为什么任务而生」。第二层是世代版本号,像 2.5、3.5,数字越新,通常代表训练数据更新、能力更强。所以「Gemini 3.5 Flash」的意思,就是「第 3.5 代的 Flash 线」。
记住这个拆法,以后不管 Google 推出 4.0 还是 5.0,你都能一眼看懂它在讲哪条线。
四条产品线各站哪里
把目前的主线摊开来看,分工大致是这样:
| 产品线 | 定位 | 适合的场景 |
|---|---|---|
| Pro | 最强推理 + 最长上下文 | 复杂推理、读长文档、写程序、需要「想清楚再答」的硬任务 |
| Flash | 速度与性价比的主力 | 量大、要实时响应、成本敏感的应用,例如聊天助手、客服、批量处理 |
| Flash-Lite | 家族里最便宜的一档 | 任务不难、但调用量超大、要把每次成本压到最低 |
| Omni | 音视频为主的全模态 | 图片、音频、视频的理解与生成,做多媒体内容 |
这四条线同时并存,Google 也会在同一个世代里一起更新它们。Flash 是多数人日常会碰到的主力,Pro 则是把难题交出去时的选择。

要补一句:闭源商用的 Gemini 之外,Google 还维护一套叫 Gemma 的开放权重小模型,授权条款允许在一定范围内自由使用。本篇谈的是 Gemini 主线,Gemma 属于另一个故事。
Omni:往「全模态」再走一步
2026 年 5 月的 Google I/O 上,Omni 是最受瞩目的新成员。
过去的 Gemini 已经能读图、读视频、听音频,算是「看得懂」多媒体。Omni 想做的是再往前一步:同时吃图片、音频、视频、文字当输入,而且能直接吐出可以再编辑的视频。对想用 AI 做短视频、做素材的人来说,这是把生成能力补进来的一条新线。
要提醒的是,这类能力推进得很快,实际开放的范围与规格会一直变动,动手前最好先查当期官方说明。
你该挑哪一个
不必死记规格,用需求倒推最省事。
要的是实时、量大、成本可控,Flash 线是默认答案,多数产品级应用都从这里起跳。碰到要读很长的文档、要做复杂推理、要写比较硬的程序,就把任务交给 Pro 线,它思考得更深、上下文窗口更长。如果你的任务其实不难,但调用次数惊人,想把账单压到最低,Flash-Lite 就是为这种情况设计的。需要处理音视频、做生成式多媒体内容,再看 Omni。
如果你已经要动手对接 API,这篇给的是方向;真正要选版本、看每百万 token 报价,建议对照官方文档的当期型号。等小企鹅的 /ai/ 教学页上线,会带大家实际操作。
收费大概是什么概念
定价这件事最会过期,这里只给相对高低,不钉死数字。
消费端的 Gemini App 有免费额度,更强的模型与额度绑在 Google 的 AI 订阅方案里。开发者走 API 则是按用量计费,规则很直觉:越轻量的模型越便宜,Flash-Lite 最省、Flash 居中、Pro 最贵;长上下文与较新的世代通常单价较高。Google 另外提供批量模式,用延后交付换取明显的折扣。确切价格以 官方定价页 为准。
这个家族会往哪走
撇开个别版本号,Gemini 这几年的走向相当清楚。
模型线一边往更会思考走,能在回答前花更多算力推理,并让开发者自己设定「要它想多久」;一边往更长的上下文走,一次塞进整本文档、整个项目的数据;再来是往会自己动手的代理能力走,能串起多步骤的工作流;最后是往全模态走,把音视频的理解与生成一起包进来。
看懂这四个方向,比记住「现在旗舰是哪一版」有用得多。版本号每隔几个月就换,但这条演进主轴相对稳定。
小企鹅的提醒
AI 模型现在的更新速度,会让任何「最新版」很快变旧版。真正值得记住的是这个家族的分层逻辑,要快选 Flash、要强选 Pro、要省选 Flash-Lite、要玩音视频看 Omni。理解了这套分工,下次 Google 再丢出新世代,你只要问一句「这是哪条线的新版」,就没问题了。