AIが脆弱性6202件を自律発見|防衛の新フェーズへ

伊東雄歩
監修者 伊東 雄歩

株式会社ウォーカー CEO。東北大学卒。MENSA会員、JDLA認定講師、健全AI教育協会理事。生成AI×教育・学習科学を専門とし、2億円超のシステム開発プロジェクトを統括。

taolis.net X note Voicy YouTube
  • Anthropicの未公開モデル「Claude Mythos Preview」がオープンソース1000件超を調査し、6202件の高/緊急レベル脆弱性候補を発見
  • 独立検証会社のチェックで、深刻度「高」と判定された1752件のうち90.6%が実在の脆弱性と確認
  • AWS・Apple・Google・Microsoft・NVIDIAなど約50社が参加する「Project Glasswing」が始動、Anthropicは最大100億円規模の枠を提供
  • 17年間誰も気づかなかったFreeBSDのリモートコード実行脆弱性「CVE-2026-4747」をAIが自律的に発見・攻略
  • 金融庁と日銀は短期間でのパッチ対応を全金融機関に要請、日本企業のセキュリティ運用が試される局面に

AIが人間を超える勢いでソフトの「穴」を見つける時代が、いよいよ現実になりました。Anthropic(アンソロピック)が2026年5月25日に公開した報告は、AIが1ヶ月で6000件超の重大な脆弱性候補を発見したという、業界を揺るがす内容でした。もはやAIは攻撃者ではなく、防衛の最前線に立つ存在になりつつあります。

Claude Mythos Preview とは何者か

未公開のフロンティアモデル

Claude Mythos Preview(クロード・ミトス・プレビュー)は、Anthropicが2026年4月に発表したまだ一般公開されていないAIモデルです。

特徴は1つ。ソフトウェアの脆弱性を自分で見つけ、悪用方法まで自動的に組み立てる能力に特化している点です。

従来のClaudeシリーズはチャットや文章生成が中心でしたが、Mythosは「セキュリティ専門の研究員」のような性能を持ちます。

既存モデルとの性能差が圧倒的

Anthropicの社内ベンチマークでは、現行の最強モデル「Claude Opus 4.6」は自律的な攻撃コード作成でほぼ0点でした。

ところがMythos Previewは、Firefoxエンジンの限定テストだけで181個の動作する攻撃コードを作成しました。

つまり1世代の進化で、AIが「初心者」から「熟練ハッカー」級にジャンプしたということです。

何が見つかったのか — 6202件という衝撃の数字

調査対象は世界中の主要OSとブラウザ

Anthropicは1000件を超えるオープンソースソフトを対象にClaude Mythos Previewをぶつけました。

結果、合計23,019件の脆弱性候補が見つかり、そのうち6202件が「高」または「緊急」レベルと判定されました。

対象は主要なLinuxディストリビューション、macOSの周辺ソフト、Windows関連、ChromeやFirefoxといった主要ブラウザを含みます。私たちが日常的に使っているソフトすべてが対象だと考えてよい規模感です。

独立検証で90.6%が実在と確認

AIが「これは脆弱性です」と言っても、本当に攻撃に使えるかは別の話です。

Anthropicは外部の独立セキュリティ研究会社にチェックを依頼しました。「高」と判定された1752件のうち、90.6%にあたる1587件が実際に存在する脆弱性と確認されました。

さらに62.4%(1094件)は「高」または「緊急」レベルとして再確認されています。AIの判定精度は人間の研究者と並ぶか、それを超える水準まで来ています。

Project Glasswing — 50社が集まったAI防衛同盟

12社のローンチパートナーが顔を揃える

Anthropicは2026年4月、これを業界全体に広げる枠組み「Project Glasswing(プロジェクト・グラスウィング)」を発表しました。

初期パートナーはAWS・Apple・Broadcom・Cisco・CrowdStrike・Google・JPMorganChase・Linux Foundation・Microsoft・NVIDIA・Palo Alto Networksの11社にAnthropicを加えた12社です。

普段は競争関係にあるテック大手と金融大手が、防衛のために手を組む形は前例がほぼありません。

追加40社にも開放、合計約50社規模

その後、OS・ブラウザ・カーネル・主要オープンソースライブラリを管理する40以上の組織にもMythos Previewへのアクセスが提供されました。

1ヶ月の運用で、ほとんどのパートナーが自社ソフトから数百件単位で重大な脆弱性を見つけており、複数社が「バグ発見ペースが10倍以上に上がった」と報告しています。

Anthropicが提供する100億円規模の枠

AnthropicはProject Glasswingに対し、最大1億ドル(約150億円)相当のモデル利用クレジットと、オープンソースセキュリティへの400万ドル(約6億円)の寄付を約束しています。

パートナー企業は実質無料でMythosを使え、見つけた脆弱性は責任ある開示プロセス(発見から90日後に公開)に沿って修正されていきます。

象徴的な事例 — 17年前のFreeBSD脆弱性を自律攻略

CVE-2026-4747:誰も気づかなかった古傷

もっとも話題になった発見が、FreeBSDのNFSサーバーに17年間眠っていた脆弱性「CVE-2026-4747」です。

これは認証なしで外部からサーバーを完全に乗っ取れるリモートコード実行(RCE)の穴で、影響範囲は世界中のサーバーに及びます。

FreeBSDはNetflixのCDNや多くの企業サーバー、ゲーム機のPlayStationなどでも使われており、見過ごされていた事実は業界に衝撃を与えました。

攻撃コードまでAIが組み立てた

驚くのは発見だけではありません。Mythosは動作する攻撃コードまで自律的に書き上げました

具体的には、NFSv4の通信を使ってカーネルのアドレスを特定し、20ガジェットのROPチェーン(プログラムの断片を組み合わせて任意のコードを実行する高度な技法)を複数のネットワークパケットに分散させる、というプロの攻撃者顔負けの手口でした。

所要時間はわずか4時間。人間の熟練エンジニアでも数週間かかる作業を、AIが半日もかからず仕上げた計算です。

そのほかの具体的な戦果

Project Glasswingでは他にも目を引く発見がありました。

  • WolfSSL(暗号化ライブラリ)でCVE-2026-5194を発見。攻撃者が銀行やメールプロバイダーになりすませる重大な穴
  • Cloudflareのコードベースから2000件のバグを発見(うち400件が高/重大度)
  • Mozilla Firefoxで271件の脆弱性を新規発見

1ヶ月でこの密度の発見は、従来の手動レビューでは1年かけても届かないレベルです。

従来のセキュリティ監査と何が違うのか

人手レビューとの違い

従来のセキュリティ監査は、ホワイトハッカーや専門会社が時間をかけてコードを読み、怪しい箇所を1つずつ検証する作業でした。

1人のシニア研究者が1ヶ月で見つけられる重大な脆弱性は数件から十数件が一般的です。Mythosは同じ期間に数千件規模を発見しているので、桁が3つくらい違います。

自動スキャンツールとの違い

ファジング(ランダムな入力をぶつけて壊れ方を見るツール)やSAST(静的解析ツール)と何が違うかも整理しておきます。

  • 従来ツール:パターンマッチングで「怪しい書き方」を検出するが、攻撃可能性まで判断できないため誤検出が多い
  • Claude Mythos:コードの意図と文脈を理解し、攻撃シナリオまで自力で組み立てるため真陽性率が極めて高い

Anthropicの内部資料によれば、Mythosは「コードマップを作成→専門サブエージェントが領域別にスキャン→分類→レポート作成」という4段階の自律プロセスで動きます。まるで小規模なセキュリティチームを1台で再現したような仕組みです。

セキュリティ研究者からの懐疑論

一方で、すべての発見が「完全に自律的か」については議論が残っています。

セキュリティ研究者の一部は「人間の誘導や指示がどこまで入っているかが不明確」と指摘しており、AnthropicのPRと実際の自律性レベルが一致しているかは検証が続いている段階です。

日本市場への影響 — 金融機関のパッチ対応が急務に

金融庁・日銀が短期対応を要請

2026年5月12日、財務省は金融システムのサイバーリスク検証のため官民作業部会の設置を発表しました。

合わせて金融庁・日銀は全金融機関に対し、Project Glasswing経由で発見された脆弱性に1ヶ月以内に対応する体制構築を要請しています(通称「Project YATA-Shield」要請)。

これまで日本企業は脆弱性の公開から数ヶ月かけてパッチ対応するのが一般的でしたが、これからは2~4週間で大量のパッチを処理する運用が求められます。

3大銀行に2週間以内のアクセス提供見通し

三菱UFJ・三井住友・みずほの3大銀行については、2週間以内にClaude Mythos Previewへのアクセスが提供される見通しと報じられています。

自社の基幹システムやインターネットバンキング基盤を、AIが自動でスキャンする取り組みが日本でも本格化する見通しです。

中小企業・SaaS事業者への波及

大企業以外への影響も無視できません。例えば、ある中小企業のIT担当者が考えるべき変化を想像してみてください。

これまで「ベンダー任せ」で済んでいたOSやライブラリのアップデートが、月単位ではなく週単位で配信される状況になる可能性があります。

パッチ適用の自動化、テスト環境の整備、緊急時の運用ルールを今から準備しておかないと、業務が止まるリスクが高まります。

よくある質問(FAQ)

Q1. Claude Mythos Previewは一般ユーザーも使えますか?

A. 現時点では使えません。Anthropicは「より強力な安全対策が整うまで一般公開しない」と明言しています。当面はProject Glasswingのパートナー企業限定の提供です。

Q2. 悪用される心配はないですか?

A. その懸念は業界でも議論されています。Anthropicは厳格な利用審査と監査ログでリスクを管理していると説明していますが、同等の能力を持つAIが他社や悪意ある勢力から登場する可能性は否定できません。だからこそ、防衛側が先に動いている、というのがProject Glasswingの位置づけです。

Q3. 個人や中小企業はどう対応すべきですか?

A. 3つあります。①OS・ブラウザ・主要アプリの自動更新を必ず有効にする、②使っていない古いソフトをアンインストールする、③重要データのバックアップを定期的に取る。基本ですが、パッチが大量に降ってくる時代では基本の徹底がもっとも効きます。

Q4. AnthropicとProject Glasswingの最終ゴールは何ですか?

A. 「攻撃側が同等のAIを持つ前に、世界中の重要ソフトを防衛しきる」ことです。Anthropicは「AI能力が攻撃側に渡る前に防衛を整える時間的猶予は限られている」と公式に述べており、競争原理での囲い込みではなく、業界全体の底上げを優先する姿勢を示しています。

まとめ

今回のニュースのポイントを振り返ります。

  • Anthropicの未公開モデル「Claude Mythos Preview」が1ヶ月で6202件の重大脆弱性候補を発見
  • 独立検証で90.6%が実在の脆弱性と確認、AIの判定精度は人間並みかそれ以上
  • AWS・Apple・Google・Microsoftなど約50社が「Project Glasswing」に参加、Anthropicは最大100億円超の枠を提供
  • 17年前のFreeBSD脆弱性をAIが自律的に4時間で攻略、攻撃コード生成能力が前世代から劇的に進化
  • 金融庁・日銀は全金融機関に短期パッチ対応の体制構築を要請、日本企業のセキュリティ運用も転換期へ

AIが防衛の主役になる時代が始まっています。まずは自分が使っているデバイスとアプリの自動更新が有効になっているかを確認するところから始めてみてください。

参考文献

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です