NotebookLM 的转录稿功能是把语音转成可用会议记录的高效工具。标准流程:iPhone 录完会议、上传到 NotebookLM、Studio 面板 1-2 分钟吐出完整转录稿、再丢给大模型整理成会议记录。整套流程约 15 分钟,比手动整理快得多。

为什么选 NotebookLM 做转录稿

市面上做语音转文字的工具一堆:Whisper、剪映、Otter.ai、macOS 内置听写。在这些工具里,NotebookLM 的差别是转录稿经过 AI 整理,输出质量比一般语音识别好一个级别

一般的语音转文字工具会忠实地把每一个字都打出来,包括「呃」「嗯」「就是」「然后那个」这些赘词。NotebookLM 会自动去掉赘词、加上段落分隔,输出的文字读起来已经很接近可用的会议记录。

加上它免费、不用另外装软件、Google 账号登录就能用。对日常会议用户来说没有换的理由。

如何用 NotebookLM 把录音变成转录稿

转录稿流程图

Step 1:用 iPhone 录音

开会前打开 iPhone 内置的「语音备忘录」App 按下录音。尽量把手机放在桌子中间,离讲话的人近一点。

环境噪音大的场景(咖啡厅、共同工作空间),录音质量会直接影响识别准确度。实测下来,吵杂餐厅的录音可能只有 6 成可用,剩下都是乱识别;安静的会议室基本上没问题。

Step 2:上传到 NotebookLM

录音结束后,把 M4A 文件 AirDrop 到电脑(或直接从 iPhone 开 NotebookLM 上传)。在 NotebookLM 里开一个新的 Notebook,把音频文件加为来源。支持 MP3、M4A、WAV,iPhone 的 M4A 直接上传就好,不用转换格式。

Step 3:等 Studio 面板产出转录稿

上传完成后,在文字框说:

输出转录稿到 Studio 界面内 输出转录稿到 Studio 界面内


NotebookLM 的 Studio 面板会自动开始处理。一段 30 分钟的录音大约 1-2 分钟就能拿到转录稿。60 分钟的录音大概 3-4 分钟。

产出的转录稿已经有段落分隔,每段大约对应一个话题或一位讲者的连续发言,不像 Whisper 那种整段不分段的输出。

### Step 4:丢给大模型做后处理

拿到转录稿之后,复制全文丢进 [Claude](/zh-cn/ai/claude/) 之类的大模型,搭配下面这段 prompt:

请整理这份会议转录稿,输出格式:

  1. 会议摘要(3-5 句)
  2. 关键决策(条列)
  3. 待办事项(谁、做什么、deadline)
  4. 需要后续讨论的议题

Claude 大概 30 秒就能整理完。出来的会议记录直接贴进 Notion,搞定。

## YouTube 视频转录稿:最快的方法

iPhone → 音频上传的流程是自己录会议时用的。如果素材本身就是 YouTube 视频,不用走那么长一段路,直接贴网址。

### 操作步骤

1. 在 YouTube 复制要的视频网址
2. NotebookLM 开一个新 Notebook,Sources 面板选「YouTube」
3. 贴上链接,送出。系统会显示一张视频缩图,表示字幕抓成功
4. 到对话框丢这段 prompt:

请根据上传的 YouTube 视频,输出:

  1. 完整转录稿(依时间轴分段,每段标上时间戳)
  2. 视频结构大纲(章节标题 + 每章 3-5 个重点)
  3. 关键引述(最值得记下的 3 句话,附出现时间)
  4. 最后给一段 150 字以内的总结

NotebookLM 会一并把转录稿、结构、引述吐出来,可以直接复制整段丢进 Notion 或 Obsidian 当学习笔记。

### 实战案例:5 分钟吃完一支 AI 新闻分析视频

有一支标题标榜「10 分钟重点整理」、实际长度 45 分钟的 OpenAI 发表会视频,可以这样处理:

1. 视频网址贴进 NotebookLM,30 秒字幕到位
2. 跑上面那段 prompt,2 分钟拿到时间戳转录稿 + 章节重点 + 关键引述
3. 快速扫大纲,锁定最值得细看的章节
4. 回 YouTube 跳到那个时间点看 5 分钟

从开始到看完想看的段落,全程不到 10 分钟。比起 1.5 倍速看完整支视频有效率得多。

### 没字幕怎么办

不是每支视频都有字幕。作者没开、或自动字幕被关掉的视频,贴链接会直接失败。

备案是用 yt-dlp 把音轨抓下来(或用 YouTube to MP3 线上工具),再走「音频文件上传」的流程。这条路虽然多 2 分钟,但 NotebookLM 的 Studio 面板会自己跑语音识别,一样能拿到质量不错的转录稿。

![NotebookLM YouTube 转录稿流程](/img/ai/notebooklm/transcript-youtube-flow.webp)

YouTube 链接功能在 Google AI Pro 订阅(台湾 NT$650/月,方案内含 NotebookLM Pro 额度)下使用最顺。免费版每天 50 次对话查询的上限,周末追片密集的时候会碰到。预算卡一点可以先考虑 Google AI Plus(NT$260/月),对话额度和 Audio Overview 次数都有放宽一些。

## NotebookLM 转录稿支持哪些音频格式

- **MP3**:最通用,录音软件导出多半是这个
- **M4A**:iPhone 语音备忘录的默认格式,直接上传不用转换格式
- **WAV**:无损格式,文件偏大但质量最好
- **YouTube 视频网址**:贴上链接,系统自动抓取字幕生成转录稿

Google Meet 和 Zoom 的录像文件也可以用。Meet 录像存在 Google Drive,下载 MP4 后上传即可。Zoom 的本地录像会同时存一个 audio-only 的 M4A,直接用那个文件比较快。

## NotebookLM 转录稿质量实测

拿同一段 25 分钟的会议录音(普通话、3 位讲者、会议室环境),分别用 NotebookLM、剪映、Whisper 做转录稿。

### 识别准确度

三个工具的基础识别率差不多,都在 90-95% 之间。差异主要在专有名词和人名。NotebookLM 对技术名词的识别比剪映好一点,但三者差距不大。

### 输出可用性

这是关键差异。

- **NotebookLM**:有段落分隔、去赘词、语句通顺。拿到手就能读,稍微校对就能当正式纪录用
- **Whisper**:原始识别精度最高,但输出是一整块未整理的文字,「嗯」「对」「然后」全都在。要花 10-15 分钟手动整理
- **剪映**:有时间轴标记,适合搭配视频使用。纯文字质量介于前两者之间

### 处理速度

NotebookLM 跟 Whisper 都在 2 分钟内完成。剪映需要先导入视频(即使只有音轨),流程多一步。

## NotebookLM vs 剪映:闽南语怎么办

![转录稿工具比较](/img/ai/notebooklm/transcript-compare.webp)

纯闽南语内容、闽南语节目录音、混杂国闽南语的会议,NotebookLM 处理起来不够稳定。

NotebookLM 的闽南语识别能力很弱。纯闽南语内容识别率大概只有 3-4 成,基本不能用。国闽南语混杂的情况好一点,普通话部分正常识别,闽南语部分会乱猜。

令人意外的是,**剪映在这里赢很多**。它的闽南语语音识别识别率大概可以到 7-8 成,而且会标注时间轴,方便回去对照原始音频文件校正。

实用做法:

- 纯普通话内容 → NotebookLM 一站搞定
- 有闽南语的内容 → 剪映先转一版文字 → 把文字稿丢进 NotebookLM 当来源 → 再用 NotebookLM 的问答功能做进一步分析

多一步,但两个工具各取所长。

## 搭配大模型的完整 Workflow

转录稿本身只是原料。真正省时间的是后面的大模型处理。

可重复的常用流程:

**日常会议** → NotebookLM 转录稿 → Claude 整理成结构化纪录 → Notion

**客户访谈** → NotebookLM 转录稿 → Claude 提取客户需求和痛点 → 写成 user story

**演讲 / 课程** → NotebookLM 转录稿 → Claude 整理成文章大纲 → 改写成博客文章

**Podcast 内容** → NotebookLM 转录稿 → Claude 抓出 5 个 key takeaways → 变成社区帖子

每个场景的 prompt 不一样,但核心逻辑一样:NotebookLM 负责把语音变成文字,Claude 负责把文字变成有用的东西。

<div class="pitfall" data-nosnippet>

## 踩坑笔记

### 文件太大上传会失败

2 小时的录音(约 150 MB)很容易上传到一半断掉。超过 1 小时的录音建议先用 QuickTime 切成 30-40 分钟的段落再上传。

### 多人同时讲话识别会失败

3 个人轮流讲没问题,但如果有人插话或两个人同时在讲,那段的识别结果基本上是乱的。所有语音转文字工具都会卡在这里。

实用解法是回去听原始录音,手动补上那几段。通常一场 30 分钟的会议里,需要手动修的大概 2-3 段,花不到 5 分钟。

### 赘词去太多偶尔会漏信息或辨认错误

NotebookLM 自动去赘词是优点,但偶尔会多去。像是「这个方案『还好』」里面的「还好」有时候会被当成赘词去掉,变成「这个方案」,意思就完全不一样了。重要会议值得多花 5 分钟快速扫一遍转录稿,确认没有被过度清理的段落。

</div>

## FAQ

**Q:NotebookLM 转录稿功能是免费的吗?**

免费版就能用。上传音频文件,Studio 面板自动产出转录稿。每天 50 次对话查询的上限,但转录稿生成没有独立次数限制。

**Q:NotebookLM 支持哪些音频格式?**

MP3、M4A、WAV 都支持。iPhone 录音的 M4A 直接上传,不用转换格式。

**Q:NotebookLM 的转录稿可以识别中文吗?**

普通话识别质量不错,专有名词偶尔出错但整体可用。闽南语支持有限,建议闽南语内容先用剪映转文字再丢进 NotebookLM。

**Q:NotebookLM 转录稿跟 Whisper 比哪个好?**

NotebookLM 有 AI 后处理,产出有段落分隔、去赘词。Whisper 原始识别精度略高但输出未整理。要直接使用转录稿的话,NotebookLM 比较方便。

**Q:Google Meet 或 Zoom 的录像文件可以上传吗?**

可以。Meet 录像下载 MP4 后上传,Zoom 本地录像的 audio-only M4A 直接上传即可。

**Q:超过 1 小时的长录音怎么处理?**

拆成 30-40 分钟的段落分次上传。超过 150MB 的文件可能上传失败。

**Q:YouTube 视频可以直接变成转录稿吗?**

可以。把 YouTube 网址贴进 Sources,系统会自动抓字幕当作来源,再请 NotebookLM 输出转录稿、章节大纲和时间轴。比自己录音上传还快。字幕没开的视频改走下载音轨上传的路线。

---

## 小企鹅的经验

NotebookLM 的转录稿是[小企鹅](/zh-cn/about/)实际每周都会用的功能。固定流程是 iPhone 录音 → AirDrop 到电脑 → 上传 NotebookLM → Studio 出转录稿 → 丢到其他大模型做后续分析(会议记录、客户访谈整理、podcast 文字化)。整套跑下来 15 分钟,比以前手动整理一个多小时快很多。

剪映的闽南语识别是补上 NotebookLM 弱项的关键工具。长辈语音频息、闽南语节目、混语会议都先用剪映转一轮,再把文字稿丢进 NotebookLM 做问答和摘要。这条双工具的路径多一步,但每个工具做自己最强的事。

YouTube 链接贴上去直接拿转录稿这个功能改了长视频消化的方式。以前 1.5 倍速硬看 45 分钟还记不住重点,现在 5 分钟就能挑出真正想看的章节。Google AI Pro 订阅的 NotebookLM Pro 额度,对需要追大量视频的工作流来说 ROI 很高。

整体经验是:转录稿本身只是中间产物,价值在后面接大模型做结构化处理。NotebookLM 的角色是把这条 pipeline 的第一段做得干净,后面才好接。

## 延伸阅读

- [NotebookLM 完整教程|免费使用方法 + Plus 升级指南](/zh-cn/ai/notebooklm/)
- [NotebookLM Podcast 中文教程|3 步骤免费生成 AI 有声节目](/zh-cn/ai/notebooklm/notebooklm-podcast-tutorial/)
- [NotebookLM 进阶技巧|从研究到演示文稿,11 个实战工作流](/zh-cn/ai/notebooklm/notebooklm-advanced-tips/)
- [剪映 AI 字幕教程|闽南语自动识别](/zh-cn/ai/creative/capcut-ai-subtitle-guide/)
- [AI 会议记录工作流|免费方案](/zh-cn/ai/meeting/meeting-free-workflow/)

---

*本文为 AI 工具功能介绍及订阅方案消费比较,不涉及证券或投资建议。实际定价以各平台官方最新公告为准,本文信息可能已过时。*

*整理:Penna|小企鹅 Penchan*