Claude Mythos衝撃|93.9%最強AIをなぜ封印

伊東雄歩
監修者 伊東 雄歩

株式会社ウォーカー CEO。東北大学卒。MENSA会員、JDLA認定講師、健全AI教育協会理事。生成AI×教育・学習科学を専門とし、2億円超のシステム開発プロジェクトを統括。

taolis.net X note Voicy YouTube
  • 2026年4月7日、Anthropicが「Claude Mythos Preview」を発表──SWE-bench Verified 93.9%の史上最強モデル
  • 一般公開せず、Apple・Google・AWS・Microsoft・NVIDIAなど12社限定で運用──「Project Glasswing」
  • OpenBSDの27年前の脆弱性を発見、Firefoxで181個の動作する攻撃コードを生成した怪物的能力
  • セキュリティ未経験のエンジニアが一晩でゼロデイ攻撃コードを完成させてしまうため封印を決断
  • Anthropicは1億ドルの利用クレジット400万ドルのオープンソース寄付で防衛側を支援

「最新AIの性能は底なし」とは聞いていても、まさか開発元が「強すぎるから一般公開しません」と宣言する日が来るとは──。2026年4月7日、AnthropicがClaude Mythos Previewを発表し、AI業界に衝撃が走りました。SWE-bench Verifiedで93.9%という史上最強スコアを叩き出しながら、使えるのは世界12社の精鋭だけ。なぜAnthropicは最強モデルを意図的に封印したのか、何が変わるのか、中学生でもわかる言葉で徹底解説します。

Claude Mythos Previewとは?最強AIなのに使えない異例のモデル

Claude Mythos Previewは、AnthropicがOpus・Sonnet・Haikuという従来3階層の上に新設した最上位フロンティアモデルです。「Mythos」はギリシャ語で「物語」を意味します。たとえるなら、これまでの最強モデルOpusが「天才プログラマー」だとしたら、Mythosは「世界中のセキュリティ専門家を集めたドリームチーム」のような存在です。

基本情報

  • 開発元:Anthropic(米サンフランシスコ)
  • 正式発表日:2026年4月7日
  • 位置づけ:Opus/Sonnet/Haikuを超える新階層の最上位モデル
  • 提供形態:一般公開なし。Project Glasswingメンバー限定
  • パラメーター数:非公開
  • 命名の由来:ギリシャ語「物語(Mythos)」
  • 初登場:2026年3月下旬の偶発的データ漏洩で存在が判明、4月に公式発表

つまりMythosは「実在は確認できるけど触れない、神話のような存在」。Anthropicの新しい命名センスがにじむ、異例のリリースです。

衝撃のベンチマーク|全項目でOpus 4.6を圧倒

Claude Mythos Previewが業界を驚かせたのは、主要ベンチマークすべてで前世代Opus 4.6を大幅更新したからです。

  • SWE-bench Verified:93.9%(Opus 4.6は80.8%)──実在のGitHubバグ解決能力で13.1ポイント向上
  • SWE-bench Pro:77.8%(Opus 4.7は64.3%)──より難易度の高い実務課題
  • Terminal-Bench:82.0%(Opus 4.7は69.4%)──ターミナル操作タスク
  • GPQA Diamond:94.6%──博士レベル科学質問
  • CyberGym:83.1%(Opus 4.6は66.6%)──サイバーセキュリティ専用ベンチ

SWE-bench Verifiedで93.9%という数字は、「現実世界のソフトウェアバグの大半を、AIが自力で正しく直せる」レベルに達したことを意味します。従来は人間のシニアエンジニアでないと解けなかった問題を、Mythosは10問中9問以上正解する世界に突入したのです。

なぜ封印?強すぎるサイバーセキュリティ能力

Anthropicが一般公開を見送った最大の理由は、Mythosが「ゼロデイ脆弱性発見・攻撃コード生成」で人類トップクラスになってしまったからです。

具体的にどれくらい強いのか

Anthropic社内の検証結果が、その異常な強さを物語ります。

  • OpenBSDの27年前の脆弱性を発見──プロのセキュリティ研究者でも見落としていた歴史的バグ
  • FFmpegの16年前の脆弱性も検出──動画処理ライブラリの根深い欠陥
  • Firefoxで181個の動作する攻撃コードを生成(Opus 4.6はわずか2個)
  • 4つの脆弱性を連鎖させたブラウザ攻撃──レンダラとOSサンドボックスを同時突破するJITヒープスプレー
  • Linuxカーネル100件のCVEのうち50%以上で権限昇格攻撃を完成

セキュリティ素人でも一晩でゼロデイが作れる

もっとも衝撃的だったのは、Anthropic社内のセキュリティ未経験エンジニアが「リモートコード実行の脆弱性を見つけて」と頼んで寝たら、翌朝には完全に動く攻撃コードが完成していたというエピソードです。OpenBSDのTCP脆弱性発見は約2万ドル、Linuxカーネル攻撃チェーンは2,000ドル弱でできてしまう。攻撃のコストが激減したのです。

Anthropicは「同等能力のモデルが広く出回る前の移行期は、攻撃側に一方的に有利」と判断し、一般公開を断念。「強すぎる薬は処方箋なしで配布できない」のと同じ理屈です。

Project Glasswing|Apple・Google・AWSなど12社の防衛連合

Mythosを使えるのは、「Project Glasswing(プロジェクト・グラスウィング)」という防衛連合に参加する企業・団体だけ。「Glasswing」は透明な羽を持つ蝶の名前で、「透明性のある防衛」を象徴しています。

参加メンバー(2026年4月時点)

  • クラウド大手:AWS(Amazon)、Google、Microsoft
  • ハードウェア:Apple、NVIDIA、Broadcom
  • セキュリティ専業:CrowdStrike、Palo Alto Networks、Cisco
  • 金融:JPMorgan Chase
  • オープンソース基盤:Linux Foundation
  • 運営元:Anthropic
  • その他、40以上の組織がインフラ保守目的で追加アクセス権を取得

Anthropicの拠出額

Anthropicは防衛側を本気で支援します。

  • 最大1億ドルのモデル利用クレジットをGlasswing参加者に提供
  • 250万ドルをAlpha-OmegaとOpenSSF(オープンソースセキュリティ団体)に寄付
  • 150万ドルをApache Software Foundationに寄付
  • 90日以内に学習内容を一般公開する予定

合計4,000万ドル超の支援で、世界の重要ソフトウェアの脆弱性を一気に潰しに行く構えです。

競合比較|OpenAI・Googleとの違い

サイバーセキュリティ特化の最先端AIという文脈で、競合と比較するとMythosのユニークさが際立ちます。

  • OpenAI GPT-5.4:汎用最強モデルだが、攻撃コード生成は安全フィルターで強く制限。サイバー特化版は別途「Trusted Access」で提供
  • Google Gemini 3.1 Pro:コーディング能力は高いが、ゼロデイ発見特化のベンチマークでMythosに大差で敗北
  • Anthropic Claude Opus 4.7:今月一般公開された最新モデル。SWE-bench 87.6%でMythosには6ポイント届かず
  • Claude Mythos Preview最強だが触れない。Glasswing経由で防衛にのみ使われる

どう使い分けるか

「日常のコーディング業務」なら → Claude Opus 4.7GPT-5.4「サイバー防衛の現場」で重要システムを守る大企業なら → Glasswing経由でMythos個人開発者や中小企業はMythosに触れる手段はないので、Opus 4.7をベースに脆弱性スキャンツールを組み合わせるのが現実解です。

日本市場への影響|国内企業はどう向き合うべきか

日本企業はGlasswingに入れるのか

現状の参加メンバーに日本企業は1社も含まれていません。NTT・富士通・日立・トヨタといった国内大手が今後招待される可能性はありますが、少なくとも初期メンバーから外れた事実は重く受け止めるべきです。日本のサイバー防衛は「Mythosを持つ米国大手」と「持たざる日本」の格差を前提に組み立て直す必要が出てきました。

国内中小企業へのインパクト

ある従業員30人のソフトウェア受託開発会社を想像してください。Mythosが解禁されないため、「自社製品にゼロデイがあるか」を自力で監査する必要があります。一方、攻撃者がMythos相当の能力を闇市場で入手するリスクは増大。セキュリティ予算を年間100万円から300万円に増やすか、AIセキュリティスキャンサービスを月額契約するといった対応が現実的になります。

90日後の波及

Anthropicは90日以内に学習内容を公開報告する方針。日本企業もこの報告書を「攻撃者が何を狙うか」のヒントとして活用できます。経済産業省や情報処理推進機構(IPA)が翻訳・解説する流れに期待しましょう。

よくある質問(FAQ)

Q. Claude Mythos Previewは個人で使える?

A. 使えません。AnthropicはAPI・Claude.ai・Claude Code経由でも一切提供しない方針です。Project Glasswing参加企業の社員でも、防衛目的に限定された厳格な運用になっています。一般ユーザーが触れる予定は当面ありません。

Q. いつになったら一般公開される?

A. 「同等能力のモデルが広く出回る時」が解禁の目安。Anthropicは「安全性保障の仕組みを開発した後、Opusクラスに機能を順次展開する」と表明しています。2026年中の解禁は絶望的で、最短でも2027年以降と見るのが妥当です。

Q. 攻撃者がMythos相当のAIを作る危険は?

A. 残念ながら時間の問題です。MythosはAnthropicが特別に攻撃力を訓練したわけではなく、「コード・推論・自律性の汎用改善の副産物」として能力が発現しました。つまり、他社の最先端モデルも同様の能力を獲得しうるため、「Mythosを封印しても攻撃力の拡散は止められない」のが冷徹な現実です。

Q. 一般公開のClaude Opus 4.7との違いは?

A. SWE-bench Verifiedで93.9%対87.6%、SWE-bench Proで77.8%対64.3%とMythosが上回ります。とくにサイバーセキュリティ系タスクで顕著な差。日常開発ならOpus 4.7で十分すぎる性能なので、「Mythosを使えなくても困らない」と考えてOKです。

Q. Mythosの判断は本当に正確?

A. 198件の発見を専門コントラクターが審査した結果、89%が同じ深刻度判定、98%が1段階以内の差でした。プロのセキュリティ研究者と遜色ないレベルで、誤検知率も低いと報告されています。

まとめ

  • 2026年4月7日、AnthropicがClaude Mythos Previewを発表──SWE-bench Verified 93.9%の史上最強モデル
  • 一般公開せず、Apple・Google・AWS・Microsoft・NVIDIAなど12社限定運用──Project Glasswing
  • OpenBSDの27年前のバグ発見、Firefoxで181個の攻撃コード生成と異次元のサイバー能力
  • セキュリティ未経験者でも一晩でゼロデイを作れるため、Anthropicが封印を決断
  • Anthropicが1億ドルのクレジットと400万ドルの寄付で防衛側を本気で支援
  • 次の一手:自社で使う重要ソフトウェアの脆弱性スキャン体制を見直し、AIセキュリティサービス(Snyk、GitHub Advanced Securityなど)の予算を年内に確保しておきましょう

Claude Mythos Previewは、「AIが人類の英知を凌駕する瞬間」を可視化した記念碑的モデルです。「強すぎるAIをどう人類に役立てるか」という根源的な問いに、Anthropicは「封印して防衛側にだけ使う」と答えました。2026年は、AIが攻撃と防衛の両面で社会基盤を揺さぶる分水嶺。今週中にできる小さな備えが、1年後の安全性を大きく左右します。

参考文献

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です