会議記録ツールは実は3種類に分かれる

種類代表役割
会議botOtter、FirefliesZoom / Meet / Teamsに参加し、リアルタイムで文字起こしし、チーム会議ライブラリを作る
リサーチ / 事後整理NotebookLM録音をsourceとして扱い、後から文字起こし、要約、citationを整理する
API文字起こしOpenAI Speech-to-Text、Whisperオープンソース開発者が自分でフローを組む。自前運用や連携ができる

ルートを間違えると、ツール選びを間違える以上に時間を失います。まずここを分けて考えます。

録音機、ノート、マイクを3つの木皿へ仕分けるこぺんぎん

Otter.ai:英語会議と個人 / チームの文字起こし

項目内容
Free300 monthly transcription minutes + 3 lifetime audio/video imports
Pro$16.99/user/月
Business$30/user/月(unlimited audio/video imports)
強み英語のリアルタイム文字起こし、speaker diarization、会議検索
弱み中国語対応は中国語中心のツールほど強くない

向いている場面:英語中心のオンライン会議、営業 / カスタマーサポートなどオンラインでのやり取りが多いチーム。

ヘッドホンをつけたこぺんぎんが、録音機の横で文字起こしの波形を聞いている

Fireflies.ai:チーム会議ライブラリと共同作業

項目内容
Freeunlimited transcription、800 mins保存 / seat
Pro$10/seat/月(年払い、8,000 mins保存、20 AI credits)
Business$19/seat/月(年払い、unlimited保存、30 AI credits)
強み会議横断検索、CRM連携、チーム会議ナレッジベース
弱み個人で単独利用するにはやや大げさ

向いている場面:毎週何度もオンライン会議がある営業 / カスタマーサポート / コンサルチーム。

会議の録音テープとノートをチーム用キャビネットへ入れるこぺんぎん

NotebookLM:録音後に資料を整理する

項目内容
Standard100 notebooks、50 sources / notebook、50 chats/day、3 audio generations/day
Pro500 notebooks、300 sources / notebook、500 chats/day、20 audio/day
ソース制限1ファイル200 MBまたは50万字。音声品質が悪いとimportに失敗することがある
強み中国語の文字起こしが安定、citationが強い、Audio Overviewは複数形式(Deep Dive / Brief / Critique / Debate)、80+言語
弱みlive botではない。会議後にアップロードする必要がある

向いている場面:個人 / 中国語中心 / 予算を抑えたい / 文字起こし + 要約 + 段落ごとのcitationが必要。

NotebookLMのロゴがついた資料本へ会議書類をしまうこぺんぎん

Whisper / OpenAI:開発者が自分でフローを作る

形態内容
OpenAI Speech-to-Text APIwhisper-1gpt-4o-mini-transcribegpt-4o-transcribegpt-4o-transcribe-diarize
アップロード上限25 MB、対応形式に制限あり
Pricing(per minute)Whisper $0.006、gpt-4o-mini-transcribe 約$0.003、gpt-4o-transcribe 約$0.006
Whisperオープンソース自前運用、ローカル実行、録音を外に出さない
強み多言語、カスタマイズ可能、自前運用できる
弱み完成済みSaaS UIがなく、自分でフローを組む必要がある。hallucination / 誤字は人のreviewが必要

向いている場面:開発者、カスタムしたい場合、機密内容を自前運用したい場合。

作業台でマイクを古い端末につなぐこぺんぎん

中国語、台湾語、中英混在は保守的に見る

ツールごとの中国語認識精度はかなり幅があります。アクセント、録音、専門用語の密度に左右されるためです。おすすめの方法は次の通りです。

  1. 普段の会議を代表する録音を1つ用意する(5-10分)。
  2. 同じ録音を3つのツールに通す。
  3. 自分の場面での実際の結果を見てから決める。

「認識率90%」のような製品横断の宣伝文句は、そのまま信じない方がいいです。たいていは各社のテストセット上の数字で、実際の会議との差は大きくなります。

台湾語の場面で現時点で一番実用的なのは、剪映 / CapCutの字幕機能です。ただし人の校正は必要です。

ヘッドホンをつけ、混ざった3本の音声線を丁寧に整理するこぺんぎん

1枚の表でツールを選ぶ

あなたの状況おすすめ
個人、中国語中心、予算0iPhone + NotebookLM
個人、動画 / 字幕iPhone + NotebookLM + 剪映 / CapCut
英語チーム、オンライン会議が多いOtter
チーム横断の会議ライブラリ、CRM連携Fireflies
機密内容、ローカルから出さないWhisperオープンソース
開発者がカスタムしたいOpenAI Speech-to-Text API

会議テーブルの前で、使うツールへしおりを動かすこぺんぎん

関連記事

よくある質問

Q: 2026年におすすめのAI会議記録ツールはどれですか?

言語と場面で変わります。中国語中心ならNotebookLM(無料、事後整理)。英語 / チーム利用ならOtterまたはFireflies。機密性が高い内容なら、Whisperのオープンソース版をローカルで動かすか、OpenAI APIを使います。どの場面にも万能なツールはありません。

Q: Otter.aiとFireflies.aiの主な違いは何ですか?

Otterは英語のリアルタイム文字起こし、speaker diarization、会議検索に強いです。Firefliesはチーム会議ライブラリ、会議横断検索、CRM連携に強く、無料プランでは800 mins保存できます。個人 / 英語ならOtter、チーム / 横断会議ライブラリならFirefliesです。

Q: Whisperは本当に無料ですか?

OpenAIのオープンソース版Whisper自体は無料です。ただしローカルで動かすなら、ハードウェアや電気代は自分で負担します。OpenAI Speech-to-Text APIはusage-based pricingで、Whisperは$0.006/minなどです。完全に0円と言えるのは、オープンソース版をローカルで動かす場合だけです。

Q: 中国語認識が一番良いツールはどれですか?

中国語の結果は録音品質、アクセント、専門用語の密度に大きく左右されるので、ツール横断で万能の結論は出しにくいです。実務では、同じテスト録音を各ツールに通し、自分の場面での結果を見てから決めるのがおすすめです。

Q: 台湾語に対応しているツールはありますか?

現時点で完璧な案はありません。剪映 / CapCutの台湾語字幕は実務で使えますが、まだ人の修正が必要です。Whisperにも台湾語をある程度扱う力はありますが、結果は揺れます。中国語と台湾語が混ざった音声の方が、純粋な台湾語より結果は良く、この分野全体がまだ発展中です。

Q: 無料枠を使い切ったらどうすればいいですか?

Otter Freeは月300 minutesと生涯3回のimport、Fireflies Freeは無制限transcriptionですが保存は800 mins、NotebookLM Standardは1日50 chats / 3 audioです。枠に当たったら、有料プランへ上げるか、別ルートに切り替えます。

Q: これらのツールは録音を保存しますか?プライバシー面で安全ですか?

クラウドツールは録音を第三者サーバーへアップロードして処理し、扱いは各社のプライバシーポリシーに従います。完全にローカルから出したくないなら、Whisperのオープンソース版をローカルで動かします。中程度のプライバシーとクラウドの便利さを両立したい場合は、retention / 学習不使用の方針が合うツールを選び、会社のセキュリティ規定に沿って判断します。


— Penchan