Google I/O 2026、「Gemini 3.5 Flash」を発表 ― エージェント・コーディング特化
Googleは2026年5月20日のGoogle I/O 2026で、エージェントとコーディングに特化した新モデル「Gemini 3.5 Flash」を発表し同日展開を開始。Terminal-Bench 2.1で76.2%などのベンチマークを公式ブログで示した。
3行まとめ
- GoogleはI/O 2026でエージェント・コーディング特化の「Gemini 3.5 Flash」を発表、同日展開開始
- Terminal-Bench 2.1で76.2%などを示し、Gemini 3.1 Pro超えと半額未満のコストを訴求
- 数値はいずれもGoogleの自社発表値で、第三者による独立検証は別途確認が必要
何が起きたか
Googleは2026年5月20日に開催した開発者向けイベント「Google I/O 2026」で、新モデル「Gemini 3.5 Flash」を発表し、同日からの展開を開始した。Google Cloudの公式ブログによると、同モデルはエージェント(自律的にタスクを進めるAI)とコーディングに特化した位置づけで、長い手順を要する複雑なタスクへの対応を強みとして打ち出している。
公式ブログが示したベンチマーク値は、ターミナル操作の評価指標「Terminal-Bench 2.1」で76.2%、エージェント性能の指標「GDPval-AA」で1656 Elo、「MCP Atlas」で83.6%、マルチモーダル理解の「CharXiv」で84.2%。Googleはこれらの主要ベンチマークで従来の「Gemini 3.1 Pro」を上回るとし、「比較対象モデルの半額未満のコストで提供されることが多い」と説明している。
あわせて、上位モデルの「Gemini 3.5 Pro」は現在テスト中で来月(2026年6月)提供予定、動画生成モデル「Gemini Omni Flash」は数週間内に開発者・企業向けに展開予定とした。
なぜ重要か
近年のモデル競争は、単なる会話精度よりも「エージェントとして実務をこなせるか」「開発作業をどれだけ自動化できるか」に軸が移りつつある。Gemini 3.5 Flashが前面に出しているTerminal-BenchやMCP Atlasといった指標は、まさにこの自律実行・ツール連携の能力を測るもので、Googleがこの領域を主戦場と見ていることがうかがえる。
加えて「半額未満」というコスト訴求は、性能だけでなく運用単価でも競合に揺さぶりをかける狙いと読める。
受け止め方
注意したいのは、ここで挙げた数値はいずれもGoogleの公式ブログが示した自社発表値である点だ。第三者による独立検証や、競合モデルとの横並び比較は別途確認が必要で、現時点でベンチマーク優位がそのまま実務での優位を意味するとは限らない。「Gemini 3.5 Pro」「Gemini Omni Flash」は本記事時点で未提供のため、実際の挙動・価格・提供範囲は今後の公開を待って判断するのが妥当だ。
📎 出典・一次ソース
このニュースの解説動画も作っています
解説動画はYouTube、速報はX(旧Twitter)で毎日更新中。
毎日のAIニュース、追えていますか?
出典付きのまとめを不定期でお届けします。登録無料・いつでも解除。

