GPT-5.6 Sol / Terra / Luna 発表──3モデル同時リリースと、記事の半分を占めたセキュリティの意味
OpenAIが2026年6月26日にGPT-5.6シリーズを発表。フラッグシップのSol、バランス型のTerra、高速低コストのLunaの3モデルを同時に投入し、命名体系も一新した。Terraは前世代GPT-5.5と同等性能で価格半分。ultraモードではサブエージェントによる並列処理を導入。だが発表記事の半分以上はサイバーセキュリティ安全策と米国政府との連携に費やされており、モデル紹介と政治的メッセージが一体になった異例の発表となった。
3行まとめ
- GPT-5.6はSol(フラッグシップ)・Terra(バランス型)・Luna(高速低コスト)の3モデル同時リリース。数字=世代、名前=性能ティアの新命名体系で、ティアは世代を超えて存続する
- TerraはGPT-5.5と同等性能で価格半分($2.50/$15 per 1M tokens)。新たにultraモード(サブエージェント並列処理)とmaxモード(最大推論深度)を導入
- 発表記事の半分以上がサイバーセキュリティ安全策と米国政府との連携に費やされ、OpenAIは「政府アクセスプロセスが長期デフォルトになるべきでない」と明言した
3モデル体系と新しい命名規則
OpenAIは2026年6月26日、GPT-5.6シリーズとして3つのモデルを同時に発表した。
- Sol(太陽):フラッグシップ。最強の推論性能を持ち、新たなmaxモードとultraモードに対応
- Terra(地球):バランス型。GPT-5.5と同等の性能を持ちながら価格は半分
- Luna(月):高速・低コスト。強い能力を維持しつつ最安価格帯
GPT-5.6から命名体系が変わった。数字(5.6)が世代を表し、Sol / Terra / Lunaが性能ティアを表す。ティアは世代と独立してアップデートできる設計で、今後GPT-6が出てもSol / Terra / Lunaの名前は継続する。
AnthropicのClaude(Opus / Sonnet / Haiku)と類似した3段構えだが、Claudeのティア名が世代ごとに変わるのに対し、OpenAIは名前を世代横断で固定する方針を示した。
価格
100万トークンあたりの価格は以下の通り。
| モデル | Input | Output |
|---|---|---|
| GPT-5.6 Sol | $5 | $30 |
| GPT-5.6 Terra | $2.50 | $15 |
| GPT-5.6 Luna | $1 | $6 |
| GPT-5.5(参考) | $5 | $30 |
SolはGPT-5.5と同価格で性能が向上。Terraは同等性能で半額という設定になっている。
キャッシュの仕組みも改善された。明示的なキャッシュブレークポイントが利用可能になり、最低30分のキャッシュ保持が保証される。キャッシュ書き込みは通常入力価格の1.25倍、キャッシュ読み込みは90%割引が継続される。
参考として、AnthropicのClaude Opus 4.6はInput $15 / Output $75。フラッグシップ同士で比較するとSolは大幅に安い。
ベンチマーク
OpenAIは3つのベンチマークを前面に出した。
Terminal-Bench 2.1(コーディング):コマンドラインでの計画・反復・ツール連携を測定するベンチマーク。GPT-5.6 Solが最高記録(SOTA)を更新した。
GeneBench v1(生物学):ゲノミクスと定量生物学の分析タスクを測定。GPT-5.5を性能で上回りつつ、使用トークンは少なかった。
ExploitBench / ExploitGym(サイバーセキュリティ):ExploitBenchではMythos Previewと同等の性能を出力トークン約1/3で達成。UCバークレーとの共同ベンチマークExploitGymでは、Sol・Terra・Lunaすべてで推論強化に伴うサイバー能力の向上が確認された。
3つ中2つがサイバーセキュリティ関連のベンチマークで、OpenAIがこの領域を特に強調していることがわかる。
新しい推論モード
maxモード:単一エージェントに最大限の推論時間を与え、深い思考を行うモード。従来のhigh / medium の上位に位置する。
ultraモード:単一エージェントの限界を超えるため、サブエージェントを活用して複雑な作業を並列処理する。司令塔のAIが複数のAIに作業を割り振る仕組みで、AnthropicのClaude Codeにおけるworkflow機能と同じ方向性にある。
Cerebras提携:7月からSolがCerebrasのハードウェア上で毎秒750トークンの速度で利用可能になる。通常APIの数倍〜十数倍の速度だが、当初は限定顧客のみ。
発表記事の半分以上がセキュリティ
GPT-5.6の発表記事で最も注目すべきは、モデル性能の説明よりもサイバーセキュリティ安全策の記述が圧倒的に多いことだ。
4層の防御スタック
- モデルレベルの訓練:禁止されたサイバー攻撃支援を拒否するよう訓練。ジェイルブレイク試行にも対応
- リアルタイム分類器:出力生成中にサイバー・生物兵器の悪用を検出。高リスク判定時は生成を一時停止し、より大きな推論モデルが文脈を確認。違反と判定されればユーザーに届く前にブロック
- アカウントレベルの監視:単一会話でなくアカウント全体の行動パターンを監視し、持続的な悪意ある利用と正当なセキュリティ研究を区別
- 段階的アクセス:リスクに応じてアクセス可能な機能範囲を調整
自動レッドチーミングに700,000 A100相当GPU時間
OpenAIは安全策のテストに700,000 A100換算GPU時間を投入したと発表した。狙いは「1つのプロンプトだけに効く攻撃」ではなく、「どんなプロンプトにも効くユニバーサルジェイルブレイク」の探索にある。人間の専門家によるレッドチームも並行して継続している。
実際のリスク評価
OpenAIのPreparedness Frameworkによると、SolはCyber Critical閾値を超えていない。ChromiumやFirefoxでバグやエクスプロイトの部品は特定できるが、フルチェーンエクスプロイトの自律的な生成はできなかった。
ただしOpenAI自身が「ベンチマーク閾値はモデルの使われ方のすべてをカバーできるわけではない」「他のツールとの組み合わせの可能性もある」と正直に記述している。
米国政府との連携──異例の政治的発表
GPT-5.6のリリースは米国政府との連携の下で行われている。
- 米国政府にモデルの性能を事前にプレビュー
- 政府の要請により、まず限定プレビュー(API + Codexで信頼パートナーのみ)から開始
- 数週間後にChatGPT / API / Codexで一般公開予定
OpenAIは発表記事の中で、以下のように明言した。
"We don't believe this kind of government access process should become the long-term default. It keeps the best tools from users, developers, enterprises, cyber defenders, and global partners who need them."
「この種の政府アクセスプロセスが長期的なデフォルトになるべきだとは考えていない。最良のツールを必要とするユーザー、開発者、企業、サイバー防衛者、グローバルパートナーから遠ざけている」という趣旨だ。
短期的にこのステップを踏むのは「数週間以内の広い公開への最も強い道筋だと考えるから」とし、サイバー大統領令の枠組みと、将来のモデルリリースのための繰り返し可能なプロセスの開発に取り組んでいるとした。
AIモデルの発表記事に政府との関係がここまで詳細に書き込まれたのは異例であり、技術仕様書と政策声明が一体になった発表と言える。
まとめ
GPT-5.6はモデルとしての進化(3ティア体系・価格攻勢・マルチエージェント)と、AI安全保障をめぐる政治的メッセージが一体になった発表だった。
記事の半分以上をセキュリティに費やし、政府との関係を公開の場で論じ、「政府プロセスがデフォルトになるべきでない」と書く。これはモデルの紹介であると同時に、AIの安全保障をめぐる公開交渉の一ページでもある。
AIモデルが強くなるほど、発表するだけで政治的な意味を持つ時代に入った。
📎 出典・一次ソース
このニュースの解説動画も作っています
解説動画はYouTube、速報はX(旧Twitter)で毎日更新中。
コメント
まだコメントはありません。最初のコメントを書いてみませんか?
AIについて聞きたいことはありますか?
質問箱で無料で受け付けています。回答は公開され、他の方の参考にもなります。
質問箱を見る →