OpenAI、ChatGPTの新デフォルト「GPT-5.5 Instant」を投入 ― 幻覚を大幅削減

OpenAIがChatGPTの新デフォルト「GPT-5.5 Instant」を公開。低遅延を保ちつつ、法律・医療・金融など高リスク領域での幻覚を社内ベンチで約52.5%削減したとされる。

3行まとめ

OpenAIがChatGPTの新デフォルト「GPT-5.5 Instant」を公開、GPT-5.3を置き換え

法律・医療・金融の幻覚を約52.5%削減と説明、ただし社内ベンチ値で独立検証はない

検索が過去会話・ファイル・Gmailを参照可能に、提供は一部有料プランから順次拡大

何が起きたか

OpenAIは2026年5月5日、ChatGPTの新しいデフォルトモデル「GPT-5.5 Instant」を公開し、従来の「GPT-5.3 Instant」を置き換えた。TechCrunchの報道によれば、新モデルは旧モデルの低遅延を維持したまま回答精度を高めることを狙ったもので、APIでは「chat-latest」として提供される。

最大の訴求点は幻覚（hallucination、事実に反する誤った主張）の削減だ。OpenAIは、法律・医療・金融といった誤りが深刻な結果を招きやすい領域での幻覚を大きく減らしたと説明している。複数の二次報道では、この削減幅を旧モデル比で約52.5%（誤り率18.7%→8.9%）とする数値が伝えられている。

ベンチマークでは、数学コンテストAIME 2025のスコアが65.4から81.2へ、マルチモーダル理解の指標MMMU-Proが69.2から76へ向上したとされる。

パーソナライズ面では、検索ツールが過去の会話・アップロードしたファイル・Gmailを参照できるようになった。どの記憶ソースが使われたかはモデル上で表示され、ユーザーは古い情報の削除や修正が可能。共有チャットでは相手に記憶ソースが見えない設計だという。

なぜ重要か

幻覚はLLM実用化の最大の障壁の一つで、特に法律・医療・金融では一つの誤りが実害につながる。OpenAIがこの3領域を名指しで成果を強調したのは、業務利用での信頼性を競争軸に据えている表れと読める。低遅延を保ったまま精度を上げた点も、日常的に最も使われる「デフォルト」モデルだからこそ影響が大きい。

受け止め方

数値は新モデルの優位を示すが、52.5%という幻覚削減幅はOpenAI自身の発表に基づく社内ベンチマーク値であり、独立検証されたものではない点に注意したい（本稿の数値はTechCrunchおよび複数の二次報道に基づく）。Gmail参照などのパーソナライズは利便性と引き換えにプライバシー上の論点を伴うため、何が参照されるかを把握したうえで使うのが現実的だ。なお提供範囲は、まず一部の有料プランから順次、無料・ビジネス・エンタープライズへ拡大されると報じられている。

OpenAI、ChatGPTの新デフォルト「GPT-5.5 Instant」を投入 ― 幻覚を大幅削減

何が起きたか

なぜ重要か

受け止め方

📎 出典・一次ソース

このニュースの解説動画も作っています

毎日のAIニュース、追えていますか？

関連記事

Claude Fable 5 完全ガイド ― 何が強く、何がブロックされ、いくらかかるのか

Microsoft、Build 2026で自社初の推論モデル「MAI-Thinking-1」を発表

Claude Opus 4.8登場、回答の「がんばり度」を選べるEffort Controlを追加