会議記録ツールは実は3種類に分かれる
| 種類 | 代表 | 役割 |
|---|---|---|
| 会議bot | Otter、Fireflies | Zoom / Meet / Teamsに参加し、リアルタイムで文字起こしし、チーム会議ライブラリを作る |
| リサーチ / 事後整理 | NotebookLM | 録音をsourceとして扱い、後から文字起こし、要約、citationを整理する |
| API文字起こし | OpenAI Speech-to-Text、Whisperオープンソース | 開発者が自分でフローを組む。自前運用や連携ができる |
ルートを間違えると、ツール選びを間違える以上に時間を失います。まずここを分けて考えます。

Otter.ai:英語会議と個人 / チームの文字起こし
| 項目 | 内容 |
|---|---|
| Free | 300 monthly transcription minutes + 3 lifetime audio/video imports |
| Pro | $16.99/user/月 |
| Business | $30/user/月(unlimited audio/video imports) |
| 強み | 英語のリアルタイム文字起こし、speaker diarization、会議検索 |
| 弱み | 中国語対応は中国語中心のツールほど強くない |
向いている場面:英語中心のオンライン会議、営業 / カスタマーサポートなどオンラインでのやり取りが多いチーム。

Fireflies.ai:チーム会議ライブラリと共同作業
| 項目 | 内容 |
|---|---|
| Free | unlimited transcription、800 mins保存 / seat |
| Pro | $10/seat/月(年払い、8,000 mins保存、20 AI credits) |
| Business | $19/seat/月(年払い、unlimited保存、30 AI credits) |
| 強み | 会議横断検索、CRM連携、チーム会議ナレッジベース |
| 弱み | 個人で単独利用するにはやや大げさ |
向いている場面:毎週何度もオンライン会議がある営業 / カスタマーサポート / コンサルチーム。

NotebookLM:録音後に資料を整理する
| 項目 | 内容 |
|---|---|
| Standard | 100 notebooks、50 sources / notebook、50 chats/day、3 audio generations/day |
| Pro | 500 notebooks、300 sources / notebook、500 chats/day、20 audio/day |
| ソース制限 | 1ファイル200 MBまたは50万字。音声品質が悪いとimportに失敗することがある |
| 強み | 中国語の文字起こしが安定、citationが強い、Audio Overviewは複数形式(Deep Dive / Brief / Critique / Debate)、80+言語 |
| 弱み | live botではない。会議後にアップロードする必要がある |
向いている場面:個人 / 中国語中心 / 予算を抑えたい / 文字起こし + 要約 + 段落ごとのcitationが必要。

Whisper / OpenAI:開発者が自分でフローを作る
| 形態 | 内容 |
|---|---|
| OpenAI Speech-to-Text API | whisper-1、gpt-4o-mini-transcribe、gpt-4o-transcribe、gpt-4o-transcribe-diarize |
| アップロード上限 | 25 MB、対応形式に制限あり |
| Pricing(per minute) | Whisper $0.006、gpt-4o-mini-transcribe 約$0.003、gpt-4o-transcribe 約$0.006 |
| Whisperオープンソース | 自前運用、ローカル実行、録音を外に出さない |
| 強み | 多言語、カスタマイズ可能、自前運用できる |
| 弱み | 完成済みSaaS UIがなく、自分でフローを組む必要がある。hallucination / 誤字は人のreviewが必要 |
向いている場面:開発者、カスタムしたい場合、機密内容を自前運用したい場合。

中国語、台湾語、中英混在は保守的に見る
ツールごとの中国語認識精度はかなり幅があります。アクセント、録音、専門用語の密度に左右されるためです。おすすめの方法は次の通りです。
- 普段の会議を代表する録音を1つ用意する(5-10分)。
- 同じ録音を3つのツールに通す。
- 自分の場面での実際の結果を見てから決める。
「認識率90%」のような製品横断の宣伝文句は、そのまま信じない方がいいです。たいていは各社のテストセット上の数字で、実際の会議との差は大きくなります。
台湾語の場面で現時点で一番実用的なのは、剪映 / CapCutの字幕機能です。ただし人の校正は必要です。

1枚の表でツールを選ぶ
| あなたの状況 | おすすめ |
|---|---|
| 個人、中国語中心、予算0 | iPhone + NotebookLM |
| 個人、動画 / 字幕 | iPhone + NotebookLM + 剪映 / CapCut |
| 英語チーム、オンライン会議が多い | Otter |
| チーム横断の会議ライブラリ、CRM連携 | Fireflies |
| 機密内容、ローカルから出さない | Whisperオープンソース |
| 開発者がカスタムしたい | OpenAI Speech-to-Text API |

関連記事
よくある質問
Q: 2026年におすすめのAI会議記録ツールはどれですか?
言語と場面で変わります。中国語中心ならNotebookLM(無料、事後整理)。英語 / チーム利用ならOtterまたはFireflies。機密性が高い内容なら、Whisperのオープンソース版をローカルで動かすか、OpenAI APIを使います。どの場面にも万能なツールはありません。
Q: Otter.aiとFireflies.aiの主な違いは何ですか?
Otterは英語のリアルタイム文字起こし、speaker diarization、会議検索に強いです。Firefliesはチーム会議ライブラリ、会議横断検索、CRM連携に強く、無料プランでは800 mins保存できます。個人 / 英語ならOtter、チーム / 横断会議ライブラリならFirefliesです。
Q: Whisperは本当に無料ですか?
OpenAIのオープンソース版Whisper自体は無料です。ただしローカルで動かすなら、ハードウェアや電気代は自分で負担します。OpenAI Speech-to-Text APIはusage-based pricingで、Whisperは$0.006/minなどです。完全に0円と言えるのは、オープンソース版をローカルで動かす場合だけです。
Q: 中国語認識が一番良いツールはどれですか?
中国語の結果は録音品質、アクセント、専門用語の密度に大きく左右されるので、ツール横断で万能の結論は出しにくいです。実務では、同じテスト録音を各ツールに通し、自分の場面での結果を見てから決めるのがおすすめです。
Q: 台湾語に対応しているツールはありますか?
現時点で完璧な案はありません。剪映 / CapCutの台湾語字幕は実務で使えますが、まだ人の修正が必要です。Whisperにも台湾語をある程度扱う力はありますが、結果は揺れます。中国語と台湾語が混ざった音声の方が、純粋な台湾語より結果は良く、この分野全体がまだ発展中です。
Q: 無料枠を使い切ったらどうすればいいですか?
Otter Freeは月300 minutesと生涯3回のimport、Fireflies Freeは無制限transcriptionですが保存は800 mins、NotebookLM Standardは1日50 chats / 3 audioです。枠に当たったら、有料プランへ上げるか、別ルートに切り替えます。
Q: これらのツールは録音を保存しますか?プライバシー面で安全ですか?
クラウドツールは録音を第三者サーバーへアップロードして処理し、扱いは各社のプライバシーポリシーに従います。完全にローカルから出したくないなら、Whisperのオープンソース版をローカルで動かします。中程度のプライバシーとクラウドの便利さを両立したい場合は、retention / 学習不使用の方針が合うツールを選び、会社のセキュリティ規定に沿って判断します。
— Penchan