NotebookLM 的 Audio Overview 把上傳的文件變成一段兩人對談的 Podcast。英文版的品質是目前 AI 工具裡相對突出的,兩個主持人對話自然到接近真人。中文版口音和斷句還沒到同樣的水準,但拿來把長報告快速「聽」過一遍仍很實用。

Audio Overview 是什麼

Google 在 2024 年 9 月推出這個功能,是 NotebookLM 最受歡迎的特色之一。系統會讀完上傳的所有來源資料,生成一段 10-20 分鐘的音檔,內容是兩個 AI 主持人用對話的方式討論資料重點。

跟單純的 text-to-speech 不同。它會消化資料、重組重點、用對話的方式把核心概念講出來。主持人之間會互相補充、有時候會反問,這種互動感是其他 AI 工具不容易做到的。

Audio Overview 設定畫面

如何用 NotebookLM 生成中文 Podcast

Step 1:建立 Notebook 並上傳來源

notebooklm.google 開一個新的 Notebook,上傳要轉成 Podcast 的資料。支援 PDF、Google Docs、網頁連結、YouTube 影片、純文字筆記、音訊檔案。

一個 Notebook 可以放多個來源,AI 會綜合所有資料來生成內容。建議放 3-5 份相關文件,太多的話 AI 容易抓不到重點。

Step 2:打開 Studio 面板

右側有個 Studio 區塊,點進去就能看到 Audio Overview 的選項。

Step 3:設定指引(選填但建議做)

生成前可以輸入一段指引,告訴 AI 要什麼風格的 Podcast。例如:

  • 「用淺顯易懂的方式解釋,目標受眾是沒有技術背景的人」
  • 「重點放在第三章的實驗結果,其他章節帶過就好」
  • 「語氣輕鬆一點,像朋友在聊天」

這步不做也行,AI 會自己判斷。加了指引之後,輸出的聚焦度會明顯提升。

Step 4:按下生成,等 2-5 分鐘

生成速度取決於來源的量。一份 10 頁的 PDF 大約 2 分鐘,5 份文件加起來可能要 5 分鐘。生成完會收到通知。

Step 5:試聽、下載

生成的音檔可以直接在瀏覽器裡播放,也可以下載 MP3。沒有浮水印,可以自由使用。

中文 vs 英文:品質差在哪

語音品質的落差是這個功能最值得提的地方。

英文版:完成度極高。兩個主持人的語調有起伏、會互相接話、偶爾還會開玩笑。社群普遍評價是目前所有 AI 工具裡,Podcast 生成品質最好的之一。

中文版:能聽,但距離自然還有一段路。具體問題是口音偏機械感、斷句位置有時候不對(該停頓的地方沒停,不該停的地方硬斷)、語調變化比英文版平很多。聽起來像兩個人在念稿,較少像在聊天的感覺。

但內容萃取能力是一樣的。中文版抓重點、組織論述的能力跟英文版沒有差距,問題純粹出在語音合成的品質。

實務上的選擇:自己要快速「聽」完一份文件的重點,中文版夠用。要分享給別人或放到公開頻道,建議用英文版,或者用逐字稿功能拿文字、自己錄音。

Audio Overview 輸出畫面

實戰場景:Audio Overview 怎麼用

場景 1:快速消化長篇研究報告

收到 40 頁以上的產業報告、deadline 又很短時,直接讀完不現實。把 PDF 丟進 NotebookLM 生一段 15 分鐘 Audio Overview,通勤時戴耳機聽完,可以抓到報告的核心論點和數據亮點,足以在會議上發言。

場景 2:自己文章的品質檢查

寫完一篇長文之後,把稿子丟進去生成 Podcast,聽 AI 怎麼講述內容。某段聽起來繞或邏輯不通順,通常代表原文也有問題。用耳朵抓問題,比反覆讀更容易發現結構性的卡頓。

場景 3:把讀書筆記變成可分享的內容

讀完一本書,把筆記加上幾篇相關書評一起丟進去。AI 會綜合這些資料生出一段有結構的討論,比起單純朗讀,對聽眾來說資訊密度更高。

場景 4:用 YouTube 逐字稿先整理素材再生 Podcast

把同主題的 YouTube 訪談做成中文 Podcast 回顧,可以走這個流程:

  1. 找 3-5 支同主題的 YouTube 影片(例如都在討論同一款新模型)
  2. 把網址直接貼進同一個 Notebook 的 Sources,NotebookLM 會自動抓所有影片的字幕
  3. 先不急著生 Audio Overview,先要 NotebookLM 輸出每支影片的章節大綱和關鍵引述,整理成一份重點摘要文件(NotebookLM 介面叫 Briefing Doc)
  4. 把這份重點摘要文件當作新的筆記加回 Notebook,刪掉原本的影片來源(保持焦點乾淨)
  5. 最後才按下 Audio Overview 生成按鈕

多這幾步的原因是:影片字幕直接餵給 Audio Overview,兩個主持人會東拉西扯每支影片都帶一點。先收斂成一份重點摘要,生出來的 Podcast 聚焦度高非常多。

YouTube 連結這個功能在 Google AI Pro 訂閱(台灣 NT$650/月,方案內含 NotebookLM Pro 額度)下使用最順。詳細操作參考 NotebookLM 逐字稿教學

如何下載 NotebookLM Podcast 的 MP3 檔案

生成完成後,Audio Overview 區塊右上角有一個下載按鈕,點一下就能存成 MP3。檔案沒有浮水印,也沒有使用限制,可以放到自己的 Podcast 頻道、分享給同事、或當作學習素材。

檔案大小取決於長度,一段 15 分鐘的音檔大約 10-15 MB。

NotebookLM Podcast 跟 ElevenLabs 等 TTS 工具比較

其他 AI Podcast 生成工具(像 ElevenLabs、Wondercraft)的定位不同。那些工具需要先寫好逐字稿,AI 負責配音。NotebookLM 的 Audio Overview 是從原始資料直接生成對話內容和語音,整個過程只需要上傳文件。

換句話說,其他工具是「把寫好的稿念出來」,NotebookLM 是「幫忙把資料消化完再講給你聽」。

目前 Audio Overview 沒有支援自訂聲音、背景音樂、或分段編輯。要做一個完整的 Podcast 節目仍然得用專業工具。但要快速把文件轉成可聽的內容,NotebookLM 是最省力的選擇。

踩坑筆記

來源太多反而品質下降

一次丟超過 10 份文件進去,AI 會東跳西跳每個來源都沾一點,但沒有一個講深。控制在 3-5 份以內,品質穩定很多。

免費版一天只有 3 次

額度用完之前要先確認來源和指引都設定好,別浪費次數在測試上。想提高額度就得升級對應的 Google AI 方案:Plus 每天 6 次、Pro 每天 20 次、Ultra 每天 200 次。

中文偶爾會夾簡體用語

上傳繁體中文資料,生成出來的 Podcast 偶爾會冒出簡體用語(像是「視頻」「資訊」「使用者」)。不影響理解,但要分享給台灣受眾會有點突兀。目前沒辦法在指引裡完全避免這個問題。

FAQ

Q:NotebookLM 的 Podcast 功能是免費的嗎?

免費版(Standard)每天 3 次 Audio Overview。Plus 每天 6 次、Pro 每天 20 次、Ultra 每天 200 次。這些方案都綁在 Google AI 訂閱底下(台灣:Plus NT$260/月、Pro NT$650/月、Ultra NT$8150/月),沒有獨立 SKU。每次生成 10-20 分鐘長度的音檔。

Q:NotebookLM 的 Podcast 支援中文嗎?

支援,但品質跟英文版差距明顯。英文版對話流暢自然,中文版口音偏機械、斷句不夠自然。內容萃取能力中英文一樣強。

Q:可以自訂 Podcast 的主持人風格嗎?

可以在生成前輸入指引,指定語氣、受眾、想強調的重點。無法選擇聲音或控制對話節奏。

Q:生成的 Podcast 可以下載嗎?

可以,直接下載 MP3,沒有浮水印,可自由使用。

Q:NotebookLM Podcast 跟 ElevenLabs 有什麼不同?

ElevenLabs 需要先寫好逐字稿,它負責配音。NotebookLM 是從原始資料直接生成對話內容和語音,只需上傳文件。


小企鵝的經驗

小企鵝主力使用 NotebookLM 的功能是逐字稿輸出,再把逐字稿丟到其他大模型做後續分析。Podcast 形式的 Audio Overview 因為現階段中文語音品質還沒到能在公開頻道用的程度,目前沒有把這個功能放進日常 Podcast 製作流程;本文中的步驟和場景判斷以官方文件、社群實測整理為主。

NotebookLM 中文支援的整體觀察是:文字輸出品質很高,圖片和簡報生成中文字會嚴重扭曲是已知坑。語音這塊夾在兩者之間,能用但有上限。

要把資料變成可聽內容、又不在意完成度差英文一截的話,這個工具拿來「快速吸收長文」很有效率。要做正式 Podcast 節目,目前還是得回到「自己寫稿、找配音」的傳統路徑。

延伸閱讀


本文為 AI 工具功能介紹及訂閱方案消費比較,不涉及證券或投資建議。實際定價以各平台官方最新公告為準,本文資訊可能已過時。

整理:Penna|小企鵝 Penchan