2026年6月11日 木曜日
AI時短ラボ
モデル· 約4

Anthropic、Claude Opus 4.8を公開 ― エージェント性能とコスト効率を強化

Anthropicが2026年5月28日にClaude Opus 4.8を公開。Claude Codeの数百サブエージェント並列実行、努力レベル制御、3倍安い高速モードを投入。価格は前世代Opusと同水準に据え置いた。

3行まとめ

  1. Anthropicが2026年5月28日にClaude Opus 4.8を公開、前世代Opus 4.7から41日での投入
  2. 数百サブエージェント並列のdynamic workflows、努力レベル制御、3倍安い高速モードが目玉
  3. 価格は前世代Opusと同水準に据え置き、dynamic workflowsはリサーチプレビュー段階

何が起きたか

Anthropicは2026年5月28日、フロンティアモデル「Claude Opus 4.8」を公開した。同社の発表によれば、API名は claude-opus-4-8 で、当日から各環境で利用可能となっている。TechCrunchは、前世代のOpus 4.7から41日での投入だと伝えている。

今回の目玉は3つの新機能だ。Claude Codeに追加された「dynamic workflows」(リサーチプレビュー)は、1つのセッションで数百のサブエージェントを並列実行できる仕組みで、Anthropicは「数十万行規模のコードベース移行を、着手からマージまで」こなせると説明する。claude.aiおよびCoworkでは「effort control(努力レベル制御)」が導入され、ユーザーが応答にかける労力の度合いを選べるようになった。さらに高速モード(fast mode)は、発表によれば従来モデル比で3倍安く、2.5倍の速度で動作する。

価格について、AnthropicおよびTechCrunchはいずれも前世代Opusと同水準への据え置きとしている。発表ページ上の数値では、通常利用が入力100万トークンあたり5ドル・出力25ドル、高速モードが入力10ドル・出力50ドルと記載されている。

ベンチマークについて、Anthropicは前世代や他モデルと比較した表を掲載している。本記事の企画段階で挙がっていたエージェント型コーディング64.3%→69.2%、ツール利用の多分野推論54.7%→57.9%といった個別スコアは、今回確認した発表ページ本文・TechCrunch記事のテキストからは数値として直接確認できなかった(詳細はSystem Cardに記載とされる)。確認できた範囲では、Online-Mind2Webで84%、Legal Agent Benchmarkで「all-pass基準で初めて10%を突破した最初のモデル」と説明されている。

なぜ重要か

注目点は性能スコアそのものより、品質と運用面の変化にある。Anthropicは、Opus 4.8が自ら書いたコードの欠陥を見過ごす確率が「前世代の約4分の1」に下がったとし、不確実性を自分から示し、根拠のない主張をしにくくなったと述べる。TechCrunchは、Bridgewater Associatesが「分析の入力と出力の問題を能動的に指摘する傾向」を評価したと伝えている。エージェントに長時間の自律作業を任せるほど、こうした自己点検の挙動が実用上の信頼性を左右する。

受け止め方

「数百のサブエージェント並列」「3倍安い高速モード」は強い訴求だが、dynamic workflowsはリサーチプレビュー段階であり、効果は実際のワークロードで検証する必要がある。なお、上位の「Mythos」クラスのモデルは安全策の整備待ちで提供が保留されており、Anthropicは「数週間のうちに提供できる見込み」としている。個別ベンチマークの細かい数値を引用する場合は、System Cardの一次情報で裏取りすることを薦めたい。

📎 出典・一次ソース

このニュースの解説動画も作っています

解説動画はYouTube、速報はX(旧Twitter)で毎日更新中。

毎日のAIニュース、追えていますか?

出典付きのまとめを不定期でお届けします。登録無料・いつでも解除。

最新AIニュースのまとめを不定期でお届け。いつでも解除できます。 登録でプライバシーポリシーに同意したものとみなします。

関連記事