モデル· 約5分
Claude Sonnet 5リリース──Opus級の性能を半額以下で全プラン開放
Anthropicが2026年6月30日にClaude Sonnet 5をリリース。Terminal-Bench 2.1で80.4%(Opus 4.8は82.7%)、知識作業GDPvalではOpusを上回る1618を記録。導入価格は入力$2/出力$10で全プラン・無料ユーザーにもデフォルト適用。
3行まとめ
- Anthropicが6月30日にClaude Sonnet 5をリリース、全プラン(無料含む)でデフォルト適用
- コーディング(Terminal-Bench 2.1)80.4%、知識作業(GDPval)1618でOpus 4.8の1615を上回る
- 導入価格は入力$2/出力$10(8月31日まで)、通常価格でも入力$3/出力$15──Opus($5/$25)の半額以下
何が起きたか
Anthropicは2026年6月30日、Claude Sonnet 5をリリースした。Anthropic公式ブログによると、全プランで利用可能で、無料ユーザーにもデフォルトモデルとして適用される。
ベンチマーク
Anthropic公式ブログが掲載したベンチマーク数値は以下のとおり。
| ベンチマーク | Sonnet 5 | Sonnet 4.6 | Opus 4.8 |
|---|---|---|---|
| SWE-bench Pro(コーディング) | 63.2% | 58.1% | 69.2% |
| Terminal-Bench 2.1(コーディング) | 80.4% | 67.0% | 82.7% |
| Humanity's Last Exam(推論・ツールなし) | 43.2% | 34.6% | 49.8% |
| Humanity's Last Exam(推論・ツールあり) | 57.4% | 46.8% | 57.9% |
| OSWorld-Verified(コンピュータ操作) | 81.2% | 78.5% | 83.4% |
| GDPval-AA v2(知識作業) | 1618 | 1395 | 1615 |
Anthropic公式の表現では「Opus 4.8に近い性能」とされており、知識作業(GDPval-AA v2)ではOpusのスコア1615をSonnet 5の1618が上回っている。コーディング(Terminal-Bench 2.1)では80.4% vs 82.7%で2.3ポイント差。
価格
| 項目 | Sonnet 5(導入価格〜8/31) | Sonnet 5(通常価格 9/1〜) | Opus 4.8(参考) |
|---|---|---|---|
| 入力 | $2/100万トークン | $3/100万トークン | $5/100万トークン |
| 出力 | $10/100万トークン | $15/100万トークン | $25/100万トークン |
Anthropic公式によると、トークナイザーの更新により、同一入力でもトークン数が1.0〜1.35倍に変動する場合がある。
安全性
Anthropic公式ブログによると、Firefox脆弱性の悪用成功率は0.0%。BrowseComp(情報探索)では62.5%を記録し、Opus 4.8の54.9%を上回った。
動画で解説しました
一次ソースのベンチマーク・価格・安全性を全部読んだ速報動画を公開しています。
但し書き
- ベンチマーク数値はすべてAnthropic公式ブログ掲載のもの。第三者による独立検証ではない
- 導入価格($2/$10)は2026年8月31日まで。以降は通常価格($3/$15)に移行
- トークナイザー更新により同一入力のトークン数が変動する場合がある(Anthropic公式記載)
- 本記事は2026年7月1日時点の情報に基づく
📎 出典・一次ソース
このニュースの解説動画も作っています
解説動画はYouTube、速報はX(旧Twitter)で毎日更新中。
コメント
まだコメントはありません。最初のコメントを書いてみませんか?
AIについて聞きたいことはありますか?
質問箱で無料で受け付けています。回答は公開され、他の方の参考にもなります。
質問箱を見る →