OpenAI、ChatGPTの新デフォルト「GPT-5.5 Instant」を投入 ― 幻覚を大幅削減
OpenAIがChatGPTの新デフォルト「GPT-5.5 Instant」を公開。低遅延を保ちつつ、法律・医療・金融など高リスク領域での幻覚を社内ベンチで約52.5%削減したとされる。
3行まとめ
- OpenAIがChatGPTの新デフォルト「GPT-5.5 Instant」を公開、GPT-5.3を置き換え
- 法律・医療・金融の幻覚を約52.5%削減と説明、ただし社内ベンチ値で独立検証はない
- 検索が過去会話・ファイル・Gmailを参照可能に、提供は一部有料プランから順次拡大
何が起きたか
OpenAIは2026年5月5日、ChatGPTの新しいデフォルトモデル「GPT-5.5 Instant」を公開し、従来の「GPT-5.3 Instant」を置き換えた。TechCrunchの報道によれば、新モデルは旧モデルの低遅延を維持したまま回答精度を高めることを狙ったもので、APIでは「chat-latest」として提供される。
最大の訴求点は幻覚(hallucination、事実に反する誤った主張)の削減だ。OpenAIは、法律・医療・金融といった誤りが深刻な結果を招きやすい領域での幻覚を大きく減らしたと説明している。複数の二次報道では、この削減幅を旧モデル比で約52.5%(誤り率18.7%→8.9%)とする数値が伝えられている。
ベンチマークでは、数学コンテストAIME 2025のスコアが65.4から81.2へ、マルチモーダル理解の指標MMMU-Proが69.2から76へ向上したとされる。
パーソナライズ面では、検索ツールが過去の会話・アップロードしたファイル・Gmailを参照できるようになった。どの記憶ソースが使われたかはモデル上で表示され、ユーザーは古い情報の削除や修正が可能。共有チャットでは相手に記憶ソースが見えない設計だという。
なぜ重要か
幻覚はLLM実用化の最大の障壁の一つで、特に法律・医療・金融では一つの誤りが実害につながる。OpenAIがこの3領域を名指しで成果を強調したのは、業務利用での信頼性を競争軸に据えている表れと読める。低遅延を保ったまま精度を上げた点も、日常的に最も使われる「デフォルト」モデルだからこそ影響が大きい。
受け止め方
数値は新モデルの優位を示すが、52.5%という幻覚削減幅はOpenAI自身の発表に基づく社内ベンチマーク値であり、独立検証されたものではない点に注意したい(本稿の数値はTechCrunchおよび複数の二次報道に基づく)。Gmail参照などのパーソナライズは利便性と引き換えにプライバシー上の論点を伴うため、何が参照されるかを把握したうえで使うのが現実的だ。なお提供範囲は、まず一部の有料プランから順次、無料・ビジネス・エンタープライズへ拡大されると報じられている。
📎 出典・一次ソース
このニュースの解説動画も作っています
解説動画はYouTube、速報はX(旧Twitter)で毎日更新中。
毎日のAIニュース、追えていますか?
出典付きのまとめを不定期でお届けします。登録無料・いつでも解除。

