NotebookLMのAudio Overviewは、アップロードした文書を2人対話形式のPodcastに変える。英語版の品質は現在のAIツールの中でもかなり突出しており、2人のホストの会話が本物に近いほど自然。中国語版のアクセントと区切りはまだ同じ水準ではないが、長いレポートを素早く「聞いて」通す用途には十分実用的。

Audio Overviewとは

Googleが2024年9月にリリースした機能で、NotebookLMの最も人気の高い特徴の1つ。システムがアップロードされたすべてのsource資料を読み、10-20分の音声ファイルを生成する。内容は2人のAIホストが資料の要点を対話形式で話すもの。

単なるtext-to-speechとは違う。資料を消化し、要点を組み替え、核心概念を会話形式で説明する。ホスト同士が補足し合い、時には問い返す。このインタラクション感は、ほかのAIツールでは出しにくい。

Audio Overview設定画面

NotebookLMで中国語Podcastを生成する方法

Step 1:Notebookを作成しsourceをアップロードする

notebooklm.googleで新しいNotebookを作り、Podcastに変換したい資料をアップロードする。PDF、Google Docs、ウェブリンク、YouTube動画、plain textノート、音声ファイルに対応している。

1つのNotebookに複数sourceを入れられ、AIがすべての資料を総合して内容を生成する。関連文書は3-5件に抑えるのがおすすめ。多すぎるとAIが要点をつかみにくくなる。

Step 2:Studioパネルを開く

右側にStudioセクションがあり、開くとAudio Overviewの選択肢が見える。

Step 3:指示を設定する(任意だがおすすめ)

生成前に指示文を入力し、AIにどんなPodcastスタイルが欲しいか伝えられる。たとえば:

  • 「技術背景がない人向けに、わかりやすく説明して」
  • 「第三章の実験結果を重点にし、他の章は軽く触れるだけでよい」
  • 「友達同士の会話のように、少し軽い語調にして」

このステップは省略でき、AIが自分で判断する。ただし指示を入れると、出力の焦点は明らかに良くなる。

Step 4:生成を押して2-5分待つ

生成速度はsource量によって変わる。10ページのPDFなら約2分、5件の文書を合わせると5分ほどかかる場合がある。生成が終わると通知が届く。

Step 5:試聴、ダウンロード

生成された音声はブラウザで直接再生でき、MP3としてダウンロードもできる。ウォーターマークはなく、自由に使える。

中国語 vs 英語:品質差はどこにあるか

この機能で最も触れる価値があるのは音声品質の差。

英語版:完成度が非常に高い。2人のホストのイントネーションに起伏があり、互いに自然に受け答えし、時々冗談も挟む。コミュニティでは、現時点のAI Podcast生成品質として最上位の1つという評価が多い。

中国語版:聞けるが、自然さまではまだ距離がある。具体的にはアクセントが機械的で、区切り位置が不自然なことがある(止まるべき場所で止まらず、止まらなくていい場所で切れる)、イントネーションの変化も英語版よりかなり平坦。会話というより、2人が原稿を読んでいるように聞こえる。

ただし内容抽出能力は同じ。中国語版でも要点を掴み、論述を組み立てる能力は英語版と差がない。問題は純粋に音声合成の品質。

実務上の選択:自分で資料の要点を素早く「聞く」なら、中国語版で十分。誰かに共有する、または公開チャンネルに載せるなら、英語版を使うか、文字起こし機能でテキストを取り、自分で録音するのがおすすめ。

Audio Overview出力画面

実戦場面:Audio Overviewをどう使うか

場面1:長い研究レポートを素早く消化する

40ページ以上の業界レポートを受け取り、deadlineが短いとき、全部読むのは現実的ではない。PDFをNotebookLMに入れて15分のAudio Overviewを生成し、通勤中にイヤホンで聞けば、レポートの核心論点とデータの見どころを掴める。会議で発言するには十分。

場面2:自分の記事の品質チェック

長文を書き終えた後、その原稿を入れてPodcastを生成し、AIがどう内容を語るか聞く。ある段落が回りくどく聞こえる、またはロジックが通っていないと感じるなら、たいてい原文にも問題がある。耳で問題を拾うほうが、何度も読み直すより構造的な詰まりを見つけやすい。

場面3:読書メモを共有可能な内容に変える

本を読み終えた後、メモに数本の関連書評を加えてまとめて入れる。AIはそれらを総合し、構造のある議論を生成する。単なる朗読よりも、聞き手にとって情報密度が高い。

場面4:YouTube文字起こしで先に素材整理してからPodcastを生成する

同じテーマのYouTubeインタビューを中国語Podcastレビューにするなら、この流れが使える:

  1. 同じテーマのYouTube動画を3-5本探す(たとえば同じ新モデルについて話している動画)
  2. URLを同じNotebookのSourcesに直接貼る。NotebookLMがすべての動画の字幕を自動取得する
  3. すぐにAudio Overviewを生成しない。先にNotebookLMに各動画の章立てと重要引用を出力させ、1つの要点サマリー文書に整理する(NotebookLM画面ではBriefing Docと呼ばれる)
  4. この要点サマリー文書を新しいノートとしてNotebookに戻し、元の動画sourceを削除する(焦点をきれいに保つ)
  5. 最後にAudio Overview生成ボタンを押す

この数ステップを挟む理由は、動画字幕をそのままAudio Overviewに渡すと、2人のホストが各動画を少しずつ触って散らかりやすいから。先に1つの要点サマリーへ収束させると、生成されるPodcastの焦点がかなり高くなる。

YouTubeリンク機能はGoogle AI Proサブスクリプション(台湾 NT$650/月、プラン内にNotebookLM Pro枠を含む)で使うのが最もスムーズ。詳しい操作はNotebookLM 文字起こしガイドを参照。

NotebookLM PodcastのMP3ファイルをダウンロードする方法

生成完了後、Audio Overviewブロック右上にダウンロードボタンがある。クリックするとMP3として保存できる。ファイルにウォーターマークはなく、使用制限もない。自分のPodcastチャンネルに入れる、同僚に共有する、学習素材として使うことができる。

ファイルサイズは長さによる。15分の音声ファイルは約10-15 MB。

NotebookLM PodcastとElevenLabsなどのTTSツール比較

ほかのAI Podcast生成ツール(ElevenLabs、Wondercraftなど)は位置づけが違う。これらのツールは先に原稿を用意し、AIが音声化する。NotebookLMのAudio Overviewは元資料から会話内容と音声を直接生成するため、必要なのは文書のアップロードだけ。

言い換えると、ほかのツールは「書かれた原稿を読み上げる」もので、NotebookLMは「資料を消化してから話してくれる」もの。

現在のAudio Overviewは、声のカスタマイズ、BGM、分段編集には対応していない。正式なPodcast番組を作るなら、まだ専門ツールが必要。ただし文書を素早く聞ける内容に変える用途では、NotebookLMが最も手間の少ない選択肢。

失敗メモ

sourceが多すぎるとかえって品質が落ちる

一度に10件を超える文書を入れると、AIはsource間を飛び回り、それぞれに少し触れるだけで深く話さない。3-5件以内に抑えると、品質はかなり安定する。

無料版は1日3回だけ

枠を使い切る前に、sourceと指示がきちんと設定されているか確認する。テストで回数を無駄にしない。枠を増やすには対応するGoogle AIプランに上げる必要がある:Plusは1日6回、Proは1日20回、Ultraは1日200回。

中国語では時々簡体字系の用語が混ざる

繁体字中国語資料をアップロードしても、生成されたPodcastに時々簡体字系の用語(「視頻」「資訊」「使用者」など)が出ることがある。理解には影響しないが、台湾向けに共有すると少し不自然。現時点では指示で完全に避けることはできない。

FAQ

Q:NotebookLMのPodcast機能は無料?

無料版(Standard)は1日3回Audio Overview。Plusは1日6回、Proは1日20回、Ultraは1日200回。これらのプランはGoogle AIサブスクリプションに紐付いている(台湾:Plus NT$260/月、Pro NT$650/月、Ultra NT$8150/月)ため、独立SKUはない。1回の生成は10-20分の音声ファイルになる。

Q:NotebookLMのPodcastは中国語に対応している?

対応しているが、品質は英語版との差が明確。英語版は会話が自然で滑らか、中国語版はアクセントが機械的で区切りもやや不自然。内容抽出能力は中英どちらも強い。

Q:Podcastのホストのスタイルはカスタマイズできる?

生成前に指示を入力し、語調、受け手、強調したいポイントを指定できる。声の選択や会話テンポの制御はできない。

Q:生成したPodcastはダウンロードできる?

できる。MP3を直接ダウンロードでき、ウォーターマークはなく自由に使える。

Q:NotebookLM PodcastとElevenLabsの違いは?

ElevenLabsは先に文字起こし原稿が必要で、音声化を担当する。NotebookLMは元資料から会話内容と音声を直接生成する。文書をアップロードするだけでよい。


こぺんぎんの体験談

こぺんぎんがNotebookLMで主に使っている機能は文字起こし出力で、その後、文字起こしをほかの大規模モデルに渡して分析する。Podcast形式のAudio Overviewは、現段階の中国語音声品質が公開チャンネルで使える水準にまだ達していないため、日常のPodcast制作workflowには入れていない。この記事内の手順と場面判断は、公式文書とコミュニティ実測の整理が中心。

NotebookLMの中国語対応についての全体的な観察は、テキスト出力品質は高く、画像とプレゼン生成内の中国語文字は大きく歪む既知の落とし穴がある、というもの。音声はその中間で、使えるが上限がある。

資料を聞ける内容に変えたい、かつ完成度が英語版より一段落ちることを気にしないなら、このツールは「長文を素早く吸収する」用途にかなり効率的。正式なPodcast番組を作るなら、現時点ではまだ「自分で原稿を書き、ナレーションを依頼する」従来ルートに戻る必要がある。

関連記事


本記事はAIツールの機能紹介およびサブスクリプションプランの消費比較であり、証券または投資助言ではありません。実際の料金は各プラットフォームの公式最新発表を基準にしてください。本記事の情報は古くなっている可能性があります。

— Penchan