Claude Mythos衝撃｜93.9%最強AIをなぜ封印

公開日: 2026-04-18最終更新: 2026-05-12

監修者伊東雄歩

株式会社ウォーカー CEO。東北大学卒。MENSA会員、JDLA認定講師、健全AI教育協会理事。生成AI×教育・学習科学を専門とし、2億円超のシステム開発プロジェクトを統括。

taolis.net X note Voicy YouTube

2026年4月7日、Anthropicが「Claude Mythos Preview」を発表──SWE-bench Verified 93.9%の史上最強モデル
一般公開せず、Apple・Google・AWS・Microsoft・NVIDIAなど12社限定で運用──「Project Glasswing」
OpenBSDの27年前の脆弱性を発見、Firefoxで181個の動作する攻撃コードを生成した怪物的能力
セキュリティ未経験のエンジニアが一晩でゼロデイ攻撃コードを完成させてしまうため封印を決断
Anthropicは1億ドルの利用クレジットと400万ドルのオープンソース寄付で防衛側を支援

「最新AIの性能は底なし」とは聞いていても、まさか開発元が「強すぎるから一般公開しません」と宣言する日が来るとは──。

2026年4月7日、AnthropicがClaude Mythos Previewを発表し、AI業界に衝撃が走りました。

SWE-bench Verifiedで93.9%という史上最強スコアを叩き出しながら、使えるのは世界12社の精鋭だけ。

なぜAnthropicは最強モデルを意図的に封印したのか、何が変わるのか、中学生でもわかる言葉で徹底解説します。

Claude Mythos Previewとは？最強AIなのに使えない異例のモデル

Claude Mythos Previewは、AnthropicがOpus・Sonnet・Haikuという従来3階層の上に新設した最上位フロンティアモデルです。

「Mythos」はギリシャ語で「物語」を意味します。

たとえるなら、これまでの最強モデルOpusが「天才プログラマー」だとしたら、Mythosは「世界中のセキュリティ専門家を集めたドリームチーム」のような存在です。

基本情報

開発元：Anthropic（米サンフランシスコ）
正式発表日：2026年4月7日
位置づけ：Opus／Sonnet／Haikuを超える新階層の最上位モデル
提供形態：一般公開なし。Project Glasswingメンバー限定
パラメーター数：非公開
命名の由来：ギリシャ語「物語（Mythos）」
初登場：2026年3月下旬の偶発的データ漏洩で存在が判明、4月に公式発表

つまりMythosは「実在は確認できるけど触れない、神話のような存在」。Anthropicの新しい命名センスがにじむ、異例のリリースです。

衝撃のベンチマーク｜全項目でOpus 4.6を圧倒

Claude Mythos Previewが業界を驚かせたのは、主要ベンチマークすべてで前世代Opus 4.6を大幅更新したからです。

SWE-bench Verified：93.9%（Opus 4.6は80.8%）──実在のGitHubバグ解決能力で13.1ポイント向上
SWE-bench Pro：77.8%（Opus 4.7は64.3%）──より難易度の高い実務課題
Terminal-Bench：82.0%（Opus 4.7は69.4%）──ターミナル操作タスク
GPQA Diamond：94.6%──博士レベル科学質問
CyberGym：83.1%（Opus 4.6は66.6%）──サイバーセキュリティ専用ベンチ

SWE-bench Verifiedで93.9%という数字は、「現実世界のソフトウェアバグの大半を、AIが自力で正しく直せる」レベルに達したことを意味します。従来は人間のシニアエンジニアでないと解けなかった問題を、Mythosは10問中9問以上正解する世界に突入したのです。

なぜ封印？強すぎるサイバーセキュリティ能力

Anthropicが一般公開を見送った最大の理由は、Mythosが「ゼロデイ脆弱性発見・攻撃コード生成」で人類トップクラスになってしまったからです。

具体的にどれくらい強いのか

Anthropic社内の検証結果が、その異常な強さを物語ります。

OpenBSDの27年前の脆弱性を発見──プロのセキュリティ研究者でも見落としていた歴史的バグ
FFmpegの16年前の脆弱性も検出──動画処理ライブラリの根深い欠陥
Firefoxで181個の動作する攻撃コードを生成（Opus 4.6はわずか2個）
4つの脆弱性を連鎖させたブラウザ攻撃──レンダラとOSサンドボックスを同時突破するJITヒープスプレー
Linuxカーネル100件のCVEのうち50%以上で権限昇格攻撃を完成

セキュリティ素人でも一晩でゼロデイが作れる

もっとも衝撃的だったのは、Anthropic社内のセキュリティ未経験エンジニアが「リモートコード実行の脆弱性を見つけて」と頼んで寝たら、翌朝には完全に動く攻撃コードが完成していたというエピソードです。

OpenBSDのTCP脆弱性発見は約2万ドル、Linuxカーネル攻撃チェーンは2,000ドル弱でできてしまう。

攻撃のコストが激減したのです。

Anthropicは「同等能力のモデルが広く出回る前の移行期は、攻撃側に一方的に有利」と判断し、一般公開を断念。「強すぎる薬は処方箋なしで配布できない」のと同じ理屈です。

Project Glasswing｜Apple・Google・AWSなど12社の防衛連合

Mythosを使えるのは、「Project Glasswing（プロジェクト・グラスウィング）」という防衛連合に参加する企業・団体だけ。「Glasswing」は透明な羽を持つ蝶の名前で、「透明性のある防衛」を象徴しています。

参加メンバー（2026年4月時点）

クラウド大手：AWS（Amazon）、Google、Microsoft
ハードウェア：Apple、NVIDIA、Broadcom
セキュリティ専業：CrowdStrike、Palo Alto Networks、Cisco
金融：JPMorgan Chase
オープンソース基盤：Linux Foundation
運営元：Anthropic
その他、40以上の組織がインフラ保守目的で追加アクセス権を取得

Anthropicの拠出額

Anthropicは防衛側を本気で支援します。

最大1億ドルのモデル利用クレジットをGlasswing参加者に提供
250万ドルをAlpha-OmegaとOpenSSF（オープンソースセキュリティ団体）に寄付
150万ドルをApache Software Foundationに寄付
90日以内に学習内容を一般公開する予定

合計4,000万ドル超の支援で、世界の重要ソフトウェアの脆弱性を一気に潰しに行く構えです。

競合比較｜OpenAI・Googleとの違い

サイバーセキュリティ特化の最先端AIという文脈で、競合と比較するとMythosのユニークさが際立ちます。

OpenAI GPT-5.4：汎用最強モデルだが、攻撃コード生成は安全フィルターで強く制限。サイバー特化版は別途「Trusted Access」で提供
Google Gemini 3.1 Pro：コーディング能力は高いが、ゼロデイ発見特化のベンチマークでMythosに大差で敗北
Anthropic Claude Opus 4.7：今月一般公開された最新モデル。SWE-bench 87.6%でMythosには6ポイント届かず
Claude Mythos Preview：最強だが触れない。Glasswing経由で防衛にのみ使われる

どう使い分けるか

「日常のコーディング業務」なら → Claude Opus 4.7かGPT-5.4。

「サイバー防衛の現場」で重要システムを守る大企業なら → Glasswing経由でMythos。

個人開発者や中小企業はMythosに触れる手段はないので、Opus 4.7をベースに脆弱性スキャンツールを組み合わせるのが現実解です。

日本市場への影響｜国内企業はどう向き合うべきか

日本企業はGlasswingに入れるのか

現状の参加メンバーに日本企業は1社も含まれていません。

NTT・富士通・日立・トヨタといった国内大手が今後招待される可能性はありますが、少なくとも初期メンバーから外れた事実は重く受け止めるべきです。

日本のサイバー防衛は「Mythosを持つ米国大手」と「持たざる日本」の格差を前提に組み立て直す必要が出てきました。

国内中小企業へのインパクト

ある従業員30人のソフトウェア受託開発会社を想像してください。

Mythosが解禁されないため、「自社製品にゼロデイがあるか」を自力で監査する必要があります。

一方、攻撃者がMythos相当の能力を闇市場で入手するリスクは増大。

セキュリティ予算を年間100万円から300万円に増やすか、AIセキュリティスキャンサービスを月額契約するといった対応が現実的になります。

90日後の波及

Anthropicは90日以内に学習内容を公開報告する方針。

日本企業もこの報告書を「攻撃者が何を狙うか」のヒントとして活用できます。

経済産業省や情報処理推進機構（IPA）が翻訳・解説する流れに期待しましょう。

よくある質問（FAQ）

Q. Claude Mythos Previewは個人で使える？

A. 使えません。

AnthropicはAPI・Claude.ai・Claude Code経由でも一切提供しない方針です。

Project Glasswing参加企業の社員でも、防衛目的に限定された厳格な運用になっています。

一般ユーザーが触れる予定は当面ありません。

Q. いつになったら一般公開される？

A. 「同等能力のモデルが広く出回る時」が解禁の目安。

Anthropicは「安全性保障の仕組みを開発した後、Opusクラスに機能を順次展開する」と表明しています。

2026年中の解禁は絶望的で、最短でも2027年以降と見るのが妥当です。

Q. 攻撃者がMythos相当のAIを作る危険は？

A. 残念ながら時間の問題です。

MythosはAnthropicが特別に攻撃力を訓練したわけではなく、「コード・推論・自律性の汎用改善の副産物」として能力が発現しました。

つまり、他社の最先端モデルも同様の能力を獲得しうるため、「Mythosを封印しても攻撃力の拡散は止められない」のが冷徹な現実です。

Q. 一般公開のClaude Opus 4.7との違いは？

A. SWE-bench Verifiedで93.9%対87.6%、SWE-bench Proで77.8%対64.3%とMythosが上回ります。

とくにサイバーセキュリティ系タスクで顕著な差。

日常開発ならOpus 4.7で十分すぎる性能なので、「Mythosを使えなくても困らない」と考えてOKです。

Q. Mythosの判断は本当に正確？

A. 198件の発見を専門コントラクターが審査した結果、89%が同じ深刻度判定、98%が1段階以内の差でした。プロのセキュリティ研究者と遜色ないレベルで、誤検知率も低いと報告されています。

まとめ

2026年4月7日、AnthropicがClaude Mythos Previewを発表──SWE-bench Verified 93.9%の史上最強モデル
一般公開せず、Apple・Google・AWS・Microsoft・NVIDIAなど12社限定運用──Project Glasswing
OpenBSDの27年前のバグ発見、Firefoxで181個の攻撃コード生成と異次元のサイバー能力
セキュリティ未経験者でも一晩でゼロデイを作れるため、Anthropicが封印を決断
Anthropicが1億ドルのクレジットと400万ドルの寄付で防衛側を本気で支援
次の一手：自社で使う重要ソフトウェアの脆弱性スキャン体制を見直し、AIセキュリティサービス（Snyk、GitHub Advanced Securityなど）の予算を年内に確保しておきましょう

Claude Mythos Previewは、「AIが人類の英知を凌駕する瞬間」を可視化した記念碑的モデルです。

「強すぎるAIをどう人類に役立てるか」という根源的な問いに、Anthropicは「封印して防衛側にだけ使う」と答えました。

2026年は、AIが攻撃と防衛の両面で社会基盤を揺さぶる分水嶺。

今週中にできる小さな備えが、1年後の安全性を大きく左右します。