会议记录工具其实分三类
| 类 | 代表 | 角色 |
|---|---|---|
| 会议 bot | Otter、Fireflies | 加入 Zoom / Meet / Teams、实时转录、团队会议库 |
| 研究 / 事后整理 | NotebookLM | 把录音当 source,事后整转录稿、摘要、citation |
| API 转录 | OpenAI Speech-to-Text、Whisper 开源 | 开发者自包流程,可自架、可整合 |
跑错路线比工具选错更费时间,先把这层分清楚。

Otter.ai:英文会议与个人 / 团队转录稿
| 项目 | 内容 |
|---|---|
| Free | 300 monthly transcription minutes + 3 lifetime audio/video imports |
| Pro | $16.99/user/月 |
| Business | $30/user/月(unlimited audio/video imports) |
| 强项 | 英文实时转录、speaker diarization、会议搜索 |
| 弱项 | 中文支持不如中文中心工具 |
适合:英文为主的线上会议、业务 / 客服重度线上沟通。

Fireflies.ai:团队会议库与协作
| 项目 | 内容 |
|---|---|
| Free | unlimited transcription、800 mins 保存 / seat |
| Pro | $10/seat/月(年付,8,000 mins 保存、20 AI credits) |
| Business | $19/seat/月(年付,unlimited 保存、30 AI credits) |
| 强项 | 跨会议搜索、CRM 整合、团队会议知识库 |
| 弱项 | 个人单独用相对 overkill |
适合:每周多场线上会议的销售 / 客服 / 顾问团队。

NotebookLM:录完之后整理数据
| 项目 | 内容 |
|---|---|
| Standard | 100 notebooks、50 sources / notebook、50 chats/day、3 audio generations/day |
| Pro | 500 notebooks、300 sources / notebook、500 chats/day、20 audio/day |
| 来源限制 | 单文件 200 MB 或 50 万字;音频文件质量差会 import 失败 |
| 强项 | 中文转录稿稳定、citation 强、Audio Overview 多种格式(Deep Dive / Brief / Critique / Debate)、80+ 语 |
| 弱项 | 不是 live bot;要事后上传 |
适合:个人 / 中文为主 / 预算敏感 / 同时需要转录稿 + 摘要 + 段落 citation。

Whisper / OpenAI:开发者自建流程
| 形态 | 内容 |
|---|---|
| OpenAI Speech-to-Text API | whisper-1、gpt-4o-mini-transcribe、gpt-4o-transcribe、gpt-4o-transcribe-diarize |
| 上传上限 | 25 MB、支持格式有限 |
| Pricing(per minute) | Whisper $0.006、gpt-4o-mini-transcribe 约 $0.003、gpt-4o-transcribe 约 $0.006 |
| Whisper 开源 | 自架、本地跑、不出本地 |
| 强项 | 多语、可定制、可自架 |
| 弱项 | 没有现成 SaaS UI,要自己包流程;hallucination / 错字仍要人工 review |
适合:开发者、要定制、敏感内容自架。

中文、台语、中英混杂要保守看
跨工具的中文识别准确率跨度大,受口音、录音、术语密度影响。建议方法:
- 找一段你日常会议的代表录音(5-10 分钟)。
- 同一段在三家跑一次。
- 看自己场景的实际表现再决定。
不要相信”准确率 90%“这种跨产品宣称数字,那是厂商在自家测试集上的表现,跟你的实际会议差距通常很大。
台语场景目前最实用的路径是剪映 / CapCut 字幕,仍需人工校对。

一张表选工具
| 你的情境 | 建议 |
|---|---|
| 个人、中文为主、预算 0 | iPhone + NotebookLM |
| 个人、影音 / 字幕 | iPhone + NotebookLM + 剪映 / CapCut |
| 英文团队、线上会议多 | Otter |
| 跨团队会议库、CRM 整合 | Fireflies |
| 敏感内容、不出本地 | Whisper 开源 |
| 开发者要定制 | OpenAI Speech-to-Text API |

延伸阅读
常见问题
Q: 2026 年 AI 会议记录工具推荐哪个?
看语言与场景。中文为主 → NotebookLM(免费、事后整理);英文 / 团队 → Otter 或 Fireflies;敏感内容 → Whisper 开源本地 或 OpenAI API。没有一个工具通吃所有场景。
Q: Otter.ai 跟 Fireflies.ai 主要差在哪?
Otter 强在英文实时转录、speaker diarization、会议搜索;Fireflies 强在团队会议库、跨会议搜索、CRM 整合(免费 800 mins 保存)。个人 / 英文 → Otter;团队 / 跨会议库 → Fireflies。
Q: Whisper 真的免费吗?
OpenAI 开源 Whisper 本身免费(本地跑要自付硬件 / 电费)。OpenAI Speech-to-Text API 是 usage-based pricing(Whisper $0.006/min 等)。完全 0 成本只在开源版本地跑这条路成立。
Q: 哪个工具的中文识别最好?
中文表现会被录音质量、口音、术语密度大幅影响,跨工具比较难得到通用结论。实现建议:先用同一段测试录音跑各家,看自己场景的结果,再决定。
Q: 有没有支持台语的工具?
目前没有完美方案。剪映 / CapCut 的台语字幕在实现中可用,但仍要人工修正;Whisper 也有部分台语能力但表现浮动。混合中台语比纯台语效果好,这个 lane 整体仍在发展。
Q: 免费额度用完之后怎么办?
Otter Free 每月 300 minutes 与 3 lifetime imports;Fireflies Free 无限 transcription 但 800 mins 保存;NotebookLM Standard 每日 50 chats / 3 audio。额度撞墙 → 升 paid tier 或改路线。
Q: 这些工具会保存我的录音吗?隐私安全吗?
云工具会把录音上传到第三方服务器处理,依各家隐私政策。要完全不出本地 → Whisper 开源本地跑。要中度隐私 + 云便利 → 选 retention / 不训练政策友善的工具,并依公司资安规范决定。
整理:Penna|小企鹅(Penchan)