2026年6月19日 金曜日
AI時短ラボ
活用· 約10

AI翻訳字幕ツール おすすめ比較──YouTube動画の多言語化【2026年版】

YouTube動画を多言語化するAI字幕翻訳ツール7選を比較。Kapwing・HappyScribe・VEED・Subtitle Editの料金・対応言語数・精度を表にまとめ、YouTube標準機能との違いも解説する。

3行まとめ

  1. YouTube標準の自動翻訳は100言語以上に対応するが精度70-90%で、固有名詞や専門用語の誤訳が多い
  2. 有料ツール(Kapwing・VEED・HappyScribe)は月$12-89で、翻訳+焼き込み+SRT出力まで一括処理できる
  3. 無料で使いたいならSubtitle Edit(オープンソース)+Whisper連携が現実的な選択肢

YouTube標準の自動翻訳──できることと限界

YouTubeには視聴者向けの自動翻訳機能が標準で備わっている。動画に字幕(自動生成または手動アップロード)があれば、視聴者が設定 > 字幕 > 自動翻訳から任意の言語を選べる仕組みだ。

対応言語は100以上(YouTube公式、2026年6月時点)。ただし以下の制限がある。

  • 精度は70-90%程度で、元の字幕品質に依存する(NoteLM.ai調べ、2026年)
  • 固有名詞・専門用語・文脈依存の表現で誤訳が頻発する
  • クリエイター側で翻訳結果を編集できない(視聴者端末でリアルタイム生成)
  • 字幕のスタイリング(フォント・色・位置)は制御不可

「とりあえず多言語対応したい」ならゼロコストで使えるが、翻訳品質をコントロールしたい場合は外部ツールが必要になる。

主要ツール比較表

以下は2026年6月時点の公式サイト記載情報に基づく。料金は年払い時の月額換算。

ツール 月額(税抜) 対応言語数 字幕精度(公称) SRT/VTT出力 焼き込み 特徴
Kapwing Pro $16/月(年払い) 70言語以上 非公開 クレジット制(1分=1クレジット)、動画編集も一体
VEED Lite $12/月(年払い) 100言語以上 非公開 字幕自動生成+翻訳、Lite年144時間上限
VEED Pro $24/月(年払い) 50言語以上(翻訳) 非公開 字幕無制限、翻訳は月20分まで
HappyScribe Basic $17/月 150言語以上 85-95% 不可(別ツール) 月120分、人力校正オプション($2/分~)
HappyScribe Business $89/月 150言語以上 85-95% 不可 月6,000分、チーム向け
Subtitle Edit 無料(OSS) Whisper/API依存 Whisper依存 不可(別ツール) GPL v3、300形式対応、ローカル動作
YouTube標準 無料 100言語以上 70-90% 不可 不可 視聴者側で自動生成、クリエイター編集不可

料金・仕様は各社の公式ページ記載値(2026年6月閲覧)。実際の精度は言語ペア・音声品質・話速で大きく変わるため、公称値は参考程度に見たほうがよい。

用途別のツール選び

とにかく安く始めたい → Subtitle Edit + Whisper

Subtitle Editはオープンソース(GPL v3)で完全無料。Whisperと連携して文字起こし→翻訳APIで多言語字幕を生成できる。ただしGUIはWindows向けで、macOS/Linuxでは動作が不安定な場合がある。字幕の焼き込み(ハードサブ)は別途ffmpegなどが必要。

動画編集と一体で処理したい → Kapwing / VEED

KapwingとVEEDは字幕生成・翻訳・焼き込みを1つのエディタ内で完結できる。Kapwingはクレジット制で月1,000クレジット(Pro)、VEEDはプランによって字幕時間の上限が異なる。短い動画を月数本程度なら、どちらのProプランでも足りる。

精度重視・長尺コンテンツ → HappyScribe

HappyScribeは人力校正オプション(99%精度、$2.25/分~)があり、教育系・企業向け動画など誤訳が許されない用途に向く。SOC 2 Type 2認証・GDPR準拠を公表しており、セキュリティ要件がある組織でも導入しやすい。

YouTube動画に字幕を追加するだけ → YouTube Studio

YouTube Studioから手動で翻訳済み字幕(.srt)をアップロードする方法もある。外部ツールで翻訳→SRT出力→YouTube Studioでアップロードという流れなら、追加コストは翻訳ツール分だけで済む。

翻訳字幕を作る基本フロー

  1. 元言語の字幕を用意する:自動生成(Whisper等)または手動作成
  2. 字幕ファイルを翻訳する:上記ツールまたはDeepL/ChatGPT等で翻訳(関連:AI翻訳ツール比較)
  3. タイミングを調整する:翻訳後は文字数が変わるため、表示タイミングの微調整が必要
  4. 焼き込みまたはアップロード:ハードサブ(映像に焼く)かソフトサブ(SRTアップ)を選ぶ

音声の文字起こし精度が翻訳品質の上流を決める。Whisperの使い方はWhisper文字起こしガイドも参照。

AI吹き替え(ダビング)との違い

字幕翻訳と別に、音声ごと多言語化する「AIダビング」ツール(HeyGen・Rask・ElevenLabs等)もある。字幕翻訳と比較すると以下の通り。

字幕翻訳 AIダビング
コスト 低い($12-89/月) 高い($24-200+/月)
制作時間 数分-数十分 数十分-数時間
視聴体験 読む負荷がある 聴くだけ、没入感が高い
精度管理 SRTを手修正できる 音声の修正は難しい
向いている動画 解説系・チュートリアル ストーリー系・プレゼン

現時点では字幕翻訳のほうがコスト・品質管理の面で扱いやすい。AIダビングは進化が速いが、イントネーションや口の動き(リップシンク)の不自然さが残る段階。

AI文字起こしツールとの組み合わせ

翻訳字幕の品質は、元の文字起こし精度に大きく左右される。Whisper文字起こしガイドで解説しているように、ローカルで動かせるWhisperモデルと組み合わせれば、文字起こし→翻訳→字幕出力を低コストで回せる。

また、AI文章作成ツール比較で取り上げたChatGPTやClaudeに、SRTファイルを渡して翻訳させる方法もある。API経由なら大量処理も可能だが、APIの料金体系を事前に確認しておくことを勧める。

正直に書くと

  • 「AI翻訳で完璧な多言語化」は現時点では難しい。どのツールも言語ペアによって精度に大きな差があり、日本語→英語は比較的まともだが、日本語→タイ語・アラビア語などは誤訳率が跳ね上がる
  • 各ツールの「対応言語数」は文字起こし対応と翻訳対応で数え方が異なることがあり、単純比較は危険
  • 無料プランは試用には十分だが、本格運用するとすぐに上限に達する。月10本以上の動画を多言語化するなら有料プラン前提で考えたほうがよい
  • 筆者はこれらのツールの全言語ペアを網羅的にテストしていない。精度の数字は各社公称値であり、自分の言語ペアで必ず試用してから判断すべき

出典・但し書き

シェア: ポスト はてブ

📎 出典・一次ソース

このニュースの解説動画も作っています

解説動画はYouTube、速報はX(旧Twitter)で毎日更新中。

コメント

まだコメントはありません。最初のコメントを書いてみませんか?

AIについて聞きたいことはありますか?

質問箱で無料で受け付けています。回答は公開され、他の方の参考にもなります。

質問箱を見る →

関連記事