NotebookLM 的 Audio Overview 把上传的文档变成一段两人对谈的 Podcast。英文版的质量是目前 AI 工具里相对突出的,两个主持人对话自然到接近真人。中文版口音和断句还没到同样的水准,但拿来把长报告快速「听」过一遍仍很实用。
Audio Overview 是什么
Google 在 2024 年 9 月推出这个功能,是 NotebookLM 最受欢迎的特色之一。系统会读完上传的所有来源数据,生成一段 10-20 分钟的音频文件,内容是两个 AI 主持人用对话的方式讨论数据重点。
跟单纯的 text-to-speech 不同。它会消化数据、重组重点、用对话的方式把核心概念讲出来。主持人之间会互相补充、有时候会反问,这种互动感是其他 AI 工具不容易做到的。

如何用 NotebookLM 生成中文 Podcast
Step 1:建立 Notebook 并上传来源
到 notebooklm.google 开一个新的 Notebook,上传要转成 Podcast 的数据。支持 PDF、Google Docs、网页链接、YouTube 视频、纯文字笔记、音频文件。
一个 Notebook 可以放多个来源,AI 会综合所有数据来生成内容。建议放 3-5 份相关文档,太多的话 AI 容易抓不到重点。
Step 2:打开 Studio 面板
右侧有个 Studio 区块,点进去就能看到 Audio Overview 的选项。
Step 3:设置指引(选填但建议做)
生成前可以输入一段指引,告诉 AI 要什么风格的 Podcast。例如:
- 「用浅显易懂的方式解释,目标受众是没有技术背景的人」
- 「重点放在第三章的实验结果,其他章节带过就好」
- 「语气轻松一点,像朋友在聊天」
这步不做也行,AI 会自己判断。加了指引之后,输出的聚焦度会明显提升。
Step 4:按下生成,等 2-5 分钟
生成速度取决于来源的量。一份 10 页的 PDF 大约 2 分钟,5 份文档加起来可能要 5 分钟。生成完会收到通知。
Step 5:试听、下载
生成的音频文件可以直接在浏览器里播放,也可以下载 MP3。没有水印,可以自由使用。
中文 vs 英文:质量差在哪
语音质量的落差是这个功能最值得提的地方。
英文版:完成度极高。两个主持人的语调有起伏、会互相接话、偶尔还会开玩笑。社区普遍评价是目前所有 AI 工具里,Podcast 生成质量最好的之一。
中文版:能听,但距离自然还有一段路。具体问题是口音偏机械感、断句位置有时候不对(该停顿的地方没停,不该停的地方硬断)、语调变化比英文版平很多。听起来像两个人在念稿,较少像在聊天的感觉。
但内容提取能力是一样的。中文版抓重点、组织论述的能力跟英文版没有差距,问题纯粹出在语音合成的质量。
实务上的选择:自己要快速「听」完一份文档的重点,中文版够用。要分享给别人或放到公开频道,建议用英文版,或者用转录稿功能拿文字、自己录音。

实战场景:Audio Overview 怎么用
场景 1:快速消化长篇研究报告
收到 40 页以上的产业报告、deadline 又很短时,直接读完不现实。把 PDF 丢进 NotebookLM 生一段 15 分钟 Audio Overview,通勤时戴耳机听完,可以抓到报告的核心论点和数据亮点,足以在会议上发言。
场景 2:自己文章的质量检查
写完一篇长文之后,把稿子丢进去生成 Podcast,听 AI 怎么讲述内容。某段听起来绕或逻辑不通顺,通常代表原文也有问题。用耳朵抓问题,比反覆读更容易发现结构性的卡顿。
场景 3:把读书笔记变成可分享的内容
读完一本书,把笔记加上几篇相关书评一起丢进去。AI 会综合这些数据生出一段有结构的讨论,比起单纯朗读,对听众来说信息密度更高。
场景 4:用 YouTube 转录稿先整理素材再生 Podcast
把同主题的 YouTube 访谈做成中文 Podcast 回顾,可以走这个流程:
- 找 3-5 支同主题的 YouTube 视频(例如都在讨论同一款新模型)
- 把网址直接贴进同一个 Notebook 的 Sources,NotebookLM 会自动抓所有视频的字幕
- 先不急着生 Audio Overview,先要 NotebookLM 输出每支视频的章节大纲和关键引述,整理成一份重点摘要文档(NotebookLM 界面叫 Briefing Doc)
- 把这份重点摘要文档当作新的笔记加回 Notebook,删掉原本的视频来源(保持焦点干净)
- 最后才按下 Audio Overview 生成按钮
多这几步的原因是:视频字幕直接喂给 Audio Overview,两个主持人会东拉西扯每支视频都带一点。先收敛成一份重点摘要,生出来的 Podcast 聚焦度高非常多。
YouTube 链接这个功能在 Google AI Pro 订阅(台湾 NT$650/月,方案内含 NotebookLM Pro 额度)下使用最顺。详细操作参考 NotebookLM 转录稿教程。
如何下载 NotebookLM Podcast 的 MP3 文件
生成完成后,Audio Overview 区块右上角有一个下载按钮,点一下就能存成 MP3。文件没有水印,也没有使用限制,可以放到自己的 Podcast 频道、分享给同事、或当作学习素材。
文件大小取决于长度,一段 15 分钟的音频文件大约 10-15 MB。
NotebookLM Podcast 跟 ElevenLabs 等 TTS 工具比较
其他 AI Podcast 生成工具(像 ElevenLabs、Wondercraft)的定位不同。那些工具需要先写好转录稿,AI 负责配音。NotebookLM 的 Audio Overview 是从原始数据直接生成对话内容和语音,整个过程只需要上传文档。
换句话说,其他工具是「把写好的稿念出来」,NotebookLM 是「帮忙把数据消化完再讲给你听」。
目前 Audio Overview 没有支持自定义声音、背景音乐、或分段编辑。要做一个完整的 Podcast 节目仍然得用专业工具。但要快速把文档转成可听的内容,NotebookLM 是最省力的选择。
踩坑笔记
来源太多反而质量下降
一次丢超过 10 份文档进去,AI 会东跳西跳每个来源都沾一点,但没有一个讲深。控制在 3-5 份以内,质量稳定很多。
免费版一天只有 3 次
额度用完之前要先确认来源和指引都设置好,别浪费次数在测试上。想提高额度就得升级对应的 Google AI 方案:Plus 每天 6 次、Pro 每天 20 次、Ultra 每天 200 次。
中文偶尔会夹简体用语
上传繁体中文数据,生成出来的 Podcast 偶尔会冒出简体用语(像是「视频」「信息」「用户」)。不影响理解,但要分享给台湾受众会有点突兀。目前没办法在指引里完全避免这个问题。
FAQ
Q:NotebookLM 的 Podcast 功能是免费的吗?
免费版(Standard)每天 3 次 Audio Overview。Plus 每天 6 次、Pro 每天 20 次、Ultra 每天 200 次。这些方案都绑在 Google AI 订阅底下(台湾:Plus NT$260/月、Pro NT$650/月、Ultra NT$8150/月),没有独立 SKU。每次生成 10-20 分钟长度的音频文件。
Q:NotebookLM 的 Podcast 支持中文吗?
支持,但质量跟英文版差距明显。英文版对话流畅自然,中文版口音偏机械、断句不够自然。内容提取能力中英文一样强。
Q:可以自定义 Podcast 的主持人风格吗?
可以在生成前输入指引,指定语气、受众、想强调的重点。无法选择声音或控制对话节奏。
Q:生成的 Podcast 可以下载吗?
可以,直接下载 MP3,没有水印,可自由使用。
Q:NotebookLM Podcast 跟 ElevenLabs 有什么不同?
ElevenLabs 需要先写好转录稿,它负责配音。NotebookLM 是从原始数据直接生成对话内容和语音,只需上传文档。
小企鹅的经验
小企鹅主力使用 NotebookLM 的功能是转录稿输出,再把转录稿丢到其他大模型做后续分析。Podcast 形式的 Audio Overview 因为现阶段中文语音质量还没到能在公开频道用的程度,目前没有把这个功能放进日常 Podcast 制作流程;本文中的步骤和场景判断以官方文档、社区实测整理为主。
NotebookLM 中文支持的整体观察是:文字输出质量很高,图片和演示文稿生成中文字会严重扭曲是已知坑。语音这块夹在两者之间,能用但有上限。
要把数据变成可听内容、又不在意完成度差英文一截的话,这个工具拿来「快速吸收长文」很有效率。要做正式 Podcast 节目,目前还是得回到「自己写稿、找配音」的传统路径。
延伸阅读
本文为 AI 工具功能介绍及订阅方案消费比较,不涉及证券或投资建议。实际定价以各平台官方最新公告为准,本文信息可能已过时。
整理:Penna|小企鹅 Penchan