2026年6月18日 木曜日
AI時短ラボ
業界· 約7

ホワイトハウス「ジェイルブレイクを全部防げ」──専門家は「技術的に不可能」と指摘

WIREDの報道によると、トランプ政権はFable 5復旧の条件としてAnthropicにジェイルブレイクの完全防止を要求。しかし独立系セキュリティ専門家は「ガードレールは一時的な対策に過ぎず、完全防止は技術的にできない」と指摘している。

3行まとめ

  1. トランプ政権はFable 5復旧の条件として、Anthropicにジェイルブレイクの完全防止を要求している(WIREDの報道による)
  2. NSAがFable 5のガードレールを無効化する方法があると結論。政府は「議論の段階は過ぎた、Anthropicが直すべき」という姿勢
  3. 独立系セキュリティ専門家は「ガードレールは一時的な対策。完全防止は技術的にできない可能性がある」と指摘

📰 関連記事Fable 5復旧交渉は平行線 / G7でAIアクセス権を議論

何が報じられたか(2026年6月18日時点)

WIREDのHugo Lowell記者が6月17日に報じたところによると、トランプ政権の当局者はAnthropicに対して以下の姿勢を取っている。

  • Fable 5を再公開したければ、政府が指摘する脆弱性に実際に対処する必要がある
  • NSA(国家安全保障局)が、Fable 5のガードレールを無効化してサイバーセキュリティ・化学・生物学関連の能力にアクセスする方法があると結論づけた
  • 政府は「ジェイルブレイクが深刻かどうかの議論はもう終わった」という立場

Anthropicの反論

WIREDによると、Anthropicは以下の主張を商務省と国家サイバー長官Sean Cairncrossのオフィスに対して技術的な会議で説明した。

  • ジェイルブレイクの影響は軽微("the effects of the jailbreaks are minimal")
  • 政権の懸念は過大評価("overblown")

しかし政府側は、この反論を受け入れていない。

「全部防げ」は可能なのか

WIREDの記事で最も重要な指摘は、政府の要求が技術的に実現可能かどうか自体が不明だという点。

Independent cybersecurity experts have increasingly taken the view that guardrails on AI models are only a stopgap solution, since skilled users and future AI models will find ways to bypass constraints—meaning that what the White House appears to want cannot be done.

(独立系サイバーセキュリティ専門家は、AIモデルのガードレールは一時的な対策に過ぎないという見方を強めている。熟練したユーザーや将来のAIが制約を回避する方法を見つけるのは避けられず、ホワイトハウスが求めていることは実現できない可能性がある)

さらに、商務省のCenter for AI Standards and InnovationもNSAも、あらゆるモデルのあらゆるジェイルブレイクを追跡する人員や余力がないと述べている。そのため政府は、AnthropicがFable 5だけでなく全てのフロンティアモデルを自主的にテストしてジェイルブレイクを見つけ、政府に報告すべきだと考えているという。

なぜ完全防止が難しいのか

ジェイルブレイクの完全防止が技術的に困難とされる理由を補足する。

ガードレールの仕組み: AIモデルの安全対策は、学習時の調整(RLHF等)とシステムプロンプトによる制約の組み合わせで成り立っている。しかしこれらは本質的にモデルの能力を「隠す」のではなく、出力を制御しているに過ぎない。

アライメント税: 安全制約を強化すればするほど、モデルの汎用的な性能が低下する現象がある。完全にジェイルブレイクを防ごうとすれば、正当な用途での性能も大幅に落ちる。

いたちごっこの構造: 新しいジェイルブレイク手法は次々と発見される。1つ塞いでも別の方法が見つかる。この構造は従来のソフトウェアセキュリティと同じだが、AIモデルの場合は自然言語が攻撃ベクトルになるため、防御の難易度がさらに高い。

時系列の整理

日付 出来事
6月8日 Anthropicが Fable 5 を公開
6月12日 米商務省が輸出管理指令を発出
6月13日 Fable 5・Mythosへの外国人アクセスが停止
6月15日 Anthropic幹部がDCで商務省と対面協議。ラトニック長官はG7からリモート参加(WIREDの報道による)
6月16-17日 G7エヴィアンでAIアクセス権の議論
6月17日 WIRED報道:政府が「ジェイルブレイク全防止」を復旧条件に。専門家は「不可能」と指摘

未確定の事項

  • Anthropicが具体的にどのような対策を講じる予定かは報じられていない
  • 「ジェイルブレイクの完全防止」の具体的な基準(何をもって「防止できた」とするか)は不明
  • Fable 5の復旧時期の見通しは立っていない
  • ホワイトハウスのスポークスパーソンはWIREDの取材に対しコメントを拒否している

出典・但し書き

  • 本記事の主要情報源はWIRED(Hugo Lowell記者、Inner Loopニュースレター、2026年6月17日付)
  • 「3人の関係者」(three people familiar with discussions)への取材に基づく報道であり、政府の公式声明ではない
  • アライメント税に関する説明は筆者による技術的補足であり、WIREDの記事には含まれていない
  • 本記事は続報があり次第更新します

📰 関連記事:Fable 5復旧交渉は平行線 / G7でAIアクセス権を議論

シェア: ポスト はてブ

📎 出典・一次ソース

このニュースの解説動画も作っています

解説動画はYouTube、速報はX(旧Twitter)で毎日更新中。

コメント

まだコメントはありません。最初のコメントを書いてみませんか?

AIについて聞きたいことはありますか?

質問箱で無料で受け付けています。回答は公開され、他の方の参考にもなります。

質問箱を見る →

関連記事