GPT-5.3 Instant System Card完全解説｜ハルシネーション26.8%削減の裏で正直に開示された安全性の「後退」とは

2026-03-052026-04-13

監修者伊東雄歩

株式会社ウォーカー CEO。東北大学卒。MENSA会員、JDLA認定講師、健全AI教育協会理事。生成AI×教育・学習科学を専門とし、2億円超のシステム開発プロジェクトを統括。

taolis.net X note Voicy YouTube

GPT-5.3 Instant System Cardは、OpenAIが公開したAIモデルの安全性評価レポート。モデルのリスクと対策を透明に開示
ハルシネーション（幻覚）をWeb検索時26.8%、内部知識のみで19.7%削減。事実精度が大幅に向上
一方で性的コンテンツ・自傷関連の安全性にGPT-5.2比で「後退」があることを正直に開示
動的マルチターン評価を新導入。メンタルヘルス・感情依存・自傷のシナリオで複数ターンの会話を評価
Preparedness Framework（準備態勢フレームワーク）に基づき、AIの深刻な害のリスクを体系的に追跡・軽減

AIモデルがアップデートされるたびに「性能が上がった」という発表は聞きますが、「どこが悪くなったか」を正直に開示するケースは稀です。

OpenAIが2026年3月に公開したGPT-5.3 Instant System Cardは、ハルシネーション削減や会話品質の向上と同時に、一部の安全性で「後退」があることを率直に認めた文書です。

AIの透明性を高めるSystem Cardの仕組みと、その内容を詳しく解説します。

System Cardとは？｜AIモデルの「成績表」

System Card（システムカード）は、AIモデルの安全性評価レポートです。

目的 — モデルの能力、リスク、安全対策、既知の限界を開発者・研究者・一般ユーザーに透明に開示する文書
内容 — 設計方針、訓練方法、安全性評価の結果、レッドチーム（攻撃側テスト）の知見、残存リスクを記載
法的な位置づけ — 法的義務ではないが、AI企業の自主的な透明性の取り組みとして業界標準になりつつある

たとえるなら、System Cardは「薬の添付文書」。

効能だけでなく、副作用やリスク、使用上の注意も書かれている。

「この薬（AI）がどう効くか」だけでなく「何に気をつけるべきか」を正直に伝える文書です。

GPT-5.3 Instantの改善点｜ハルシネーションとsycophancy

System Cardが開示したポジティブな改善は以下の通りです。

ハルシネーション削減 — Web検索使用時に26.8%削減、内部知識のみの回答で19.7%削減
Sycophancy（過剰な追従）の削減 — 「素晴らしい質問ですね」「お役に立ててうれしいです」などの定型的な追従を排除
不必要な拒否の削減 — 安全に回答可能な質問への過剰な拒否を大幅に低減
説教的な前置きの排除 — 敏感なトピックでの「まず注意点をお伝えしますが」という防衛的な前置きを削減

正直に開示された「後退」｜安全性の一部悪化

System Cardの注目すべき点は、GPT-5.3 Instantが一部の安全性指標で前モデルより悪化していることを正直に開示していることです。

性的コンテンツ — GPT-5.2/5.1と比較して、不許可の性的コンテンツに関する安全性が後退
自傷関連 — GPT-5.2と比較して、自傷に関する安全性が後退。標準評価と動的評価の両方で確認
暴力関連 — 暴力的なコンテンツの後退も見られるが、統計的有意性が低い

これは、「会話をより自然にする」（sycophancy削減、拒否の低減）と「有害なコンテンツを拒否する」の間にトレードオフが存在することを示しています。会話の自然さを上げると、一部の有害コンテンツへのガードが薄くなるリスクがある——この事実を率直に認めた点が、System Cardの価値です。

たとえるなら、「車のブレーキを軽くして乗り心地を良くしたが、急ブレーキの効きが若干落ちた」という報告。改善と後退の両方を正直に伝える姿勢です。

動的マルチターン評価｜新しいテスト手法

GPT-5.3 Instant System Cardでは、新しい安全性テスト手法が導入されています。

動的マルチターン評価 — 従来の「1つの質問→1つの回答」評価ではなく、複数ターンの会話全体を通じてモデルの安全性を評価
対象領域 — メンタルヘルス、感情依存、自傷の3分野に特化した評価シナリオ
リアルなシミュレーション — モデルの回答に応じて会話の流れが変化する適応型テスト。実際のユーザーとの会話パターンに近い評価が可能

従来のテストが「1問1答のペーパーテスト」なら、新テストは「実技試験」。長い会話の中でAIが適切に振る舞えるかを、より現実に近い形で検証します。

Preparedness Framework｜AIリスクの体系的管理

概要 — OpenAIが策定した、AIの深刻な害のリスクを追跡・軽減するためのフレームワーク
リスクカテゴリ — サイバーセキュリティ、生物学的脅威、説得・操作、自律性の4領域を評価
リスクレベル — Low / Medium / High / Critical の4段階で評価。GPT-5.3 Instantはほとんどの領域でLow〜Medium
GPT-5.3への適用 — GPT-5.3 Instantの安全対策はGPT-5.2 System Cardと「大部分が同じ」とされ、段階的な改善アプローチ

なぜSystem Cardが重要なのか｜AI透明性の未来

ユーザーの信頼構築 — 「何ができて何ができないか」を事前に知ることで、AIへの適切な期待値が設定できる
開発者の指針 — APIを使ってアプリを開発する際の安全対策設計に活用可能
規制への対応 — EUのAI規制法（AI Act）など、世界的なAI規制の流れの中で、自主的な透明性が規制対応の基盤に
業界標準化 — OpenAI以外にも、Anthropic（Model Card）、Google（Safety Information）など、各社が類似の取り組みを開始

よくある質問（FAQ）

Q. System Cardは誰でも読めますか？

はい。

OpenAIの公式サイトで無料で公開されています。

技術的な内容も含まれますが、概要セクションは一般ユーザーにも理解しやすく書かれています。

Q. 安全性の「後退」は危険ですか？

現実的なリスクは限定的です。

OpenAIは多層的な安全対策（フィルタリング、モデルレベルのガード、利用規約による制限）を維持しています。

System Cardは「相対的な変化」を報告しており、絶対的な安全性が低いことを意味するものではありません。

Q. 他社のAI（Claude、Gemini）もSystem Cardを出していますか？

AnthropicはModel Card、GoogleはTechnical Reportとして類似の文書を公開しています。各社のフォーマットは異なりますが、透明性の取り組みは業界全体で広がっています。

Q. System Cardの内容は法的に拘束力がありますか？

現時点では法的拘束力はありません。

あくまで企業の自主的な透明性の取り組みです。

ただし、EUのAI規制法などでは、今後AIモデルの情報開示が法的に義務付けられる可能性があります。

まとめ

この記事のポイントを振り返りましょう。

System CardはAIモデルの安全性評価を透明に開示する公式レポート
GPT-5.3 Instantはハルシネーションを26.8%削減しつつ、一部の安全性で後退を正直に開示
会話の自然さと安全性のガードにはトレードオフが存在することが明らかに
動的マルチターン評価の導入で、より現実的な安全性テストが可能に
System Cardはユーザー・開発者・規制当局にとって、AI信頼構築の基盤となる重要文書

「AIは便利だが信用できるのか？」——この疑問に対する答えは、System Cardのような透明性の取り組みにあります。

改善だけでなく後退も正直に伝える。

この姿勢こそが、AIと人間の信頼関係を築く第一歩です。

参考文献

OpenAI. (2026). GPT-5.3 Instant System Card. OpenAI
OpenAI. (2026). GPT-5.3 Instant System Card – Deployment Safety Hub. OpenAI Deployment Safety
OpenAI. (2026). GPT-5.3 Instant: Smoother, more useful everyday conversations. OpenAI
TamilTech. (2026). GPT-5.3 Instant System Card: OpenAI Fixes Cringe & Sycophancy. TamilTech
VentureBeat. (2026). GPT-5.3 Instant cuts hallucinations by 26.8%. VentureBeat