Claude Mythosプレビュー:Anthropicの未公開AIが、人々が何十年も見逃していたLinuxおよびOpenBSDの不具合を悪用(クラック)した

Coinpedia

未公開のAnthropic「Claude Mythos Preview」が、すべての主要なOSおよびWebブラウザにわたり、数千件の重大度の高いゼロデイ脆弱性を自律的に特定したことで、同社は、防御型サイバーセキュリティ連合「Project Glasswing」を立ち上げました。この連合は、AI利用クレジットとして最大$100 millionの支援を受けています。

要点:

  • AnthropicのClaude Mythos PreviewはCybergymで83.1%を獲得し、主要なOSとブラウザのすべてにまたがって数千件のゼロデイを見つけました。
  • Project Glasswingは2026年4月7日に開始され、11の創設パートナーを擁し、防御側向けのMythos利用クレジットとして最大$100 millionが提供されます。
  • 27歳のOpenBSDの欠陥と16歳のFFmpegのバグは、Mythosが数時間でそれらを見つけるまで、数百万件の自動テストを生き延びました。

Claude Mythos AIはCybergymで83%を獲得し、主要なすべてのブラウザとOSにまたがる重大な欠陥を発見

Anthropicが「フロンティアAIの歴史における、最大規模の単体モデルとしての能力向上」と説明するこのモデルは、トレーニングを完了し、2026年4月7日に公に発表されました。内部の詳細が3月下旬に、誤設定されたコンテンツ管理システムによって約3,000の内部ファイルが露出したことが判明した後のことです。

Anthropicは、Claude Mythos Previewを一般公開もしないし、同社の一般APIを通じても提供しません。同社は、そのモデルが、未知のソフトウェアの欠陥を、人間の専門家や従来のAIシステムの双方を上回る速度と規模で発見し、悪用できることを実証した後、アクセスを精査されたパートナーの限定グループに制限しました。

サイバーセキュリティのベンチマークにおいて、MythosとClaude Opus 4.6のギャップは見過ごしにくいものです。MythosはCybergymで83.1%を獲得したのに対し、Opus 4.6は66.6%でした。またSWE-bench Verifiedでは93.9%対80.8%でした。SWE-bench Proでは77.8%対53.4%で、24ポイント差です。ツールなしのHumanity’s Last Examでは56.8%を達成し、前モデルは40.0%でした。

このモデルは、これらのバグを見つけるためにサイバーセキュリティ特化のトレーニングを必要としません。向上の要因は、推論におけるより広範な進歩、マルチステップの計画、そして自律的なエージェント的挙動です。隔離されたコンテナ内に対象のコードベースが与えられると、ソースコードを読み、メモリセーフティの欠陥に関する仮説を立て、ソフトウェアをコンパイルして実行し、Address Sanitizerのようなデバッガを使用し、脆弱性の可能性に基づいてファイルを順位付けし、動作するproof-of-concept(実証概念)エクスプロイトを伴う検証済みのバグ報告を作成します。

これらのエクスプロイトの中には、ほとんど人手の指示を要しないものもありました。Tomshardware.comによれば、27歳のOpenBSD TCP SACK脆弱性――攻撃者が悪意のあるパケットを細工することで、応答する任意のホストをリモートからクラッシュさせられる微妙な整数オーバーフロー――は、約1,000回の実行後に自律的に発見され、総コストは$20,000未満だったと報じられています。16歳のFFmpeg H.264のバグは、Mythosがそれを見つけるまでに500万回超の自動テストと複数の監査を生き延びました。

ブラウザの結果は特に注目を集めました。Firefox 147のJavaScriptエンジンのテストで、Mythosは181件の完全なシェルエクスプロイトと29件のレジスタ制御ケースを生成しました。Claude Opus 4.6は、同じテストセットで2件のシェルエクスプロイトしか作れませんでした。このモデルは、直近の100件のCVEを40件の悪用可能な候補に絞り込み、そのうち半数超を実際に悪用した後、Linuxカーネルの権限昇格チェーン(サーバ上でユーザーからrootへ)も実行できることを構築しました。

人間のバリデータは、モデルの脆弱性報告198件をレビューし、重大度の評価に89%の確率で同意しました。重大度レベルが1段階以内の一致では98%の同意でした。

Project Glasswing

特定されたバグのうち、これまでに完全にパッチが当たっているのは1%未満です。Anthropicは責任ある開示を調整し、未パッチの問題に対して暗号学的SHA-3のコミットメントを公開し、完全な詳細をリリースする前に90日超+45日というタイムラインに従います。FreeBSD NFSサーバのリモートコード実行バグであるCVE-2026-4747(17年前のもの)――完全な非認証のrootアクセスを許すもの――は、すでに開示の中で挙げられている事例の1つです。

Claude Mythos Preview: Anthropic's Unreleased AI Cracked Linux and OpenBSD Bugs Humans Missed for Decades

モデルとともに発表されたProject Glasswingは、同様のツールが広く利用可能になる前に、これらの能力を防御へと向けることを目指すAnthropicの取り組みです。創設パートナーには、Amazon Web Services、Apple、Broadcom、Cisco、Crowdstrike、Google、JPMorganChase、Linux Foundation、Microsoft、Nvidia、Palo Alto Networksが含まれます。アクセスは、さらに40を超える追加の重要なソフトウェア組織へ拡張されています。

Anthropicはオープンソースのセキュリティ寄付として$4 millionを拠出することを約束しました。内訳は、Linux Foundation経由のOpenSSFを通じてAlpha-Omegaへ$2.5 million、Apache Software Foundationへ$1.5 millionです。

同社は、MythosのようなAIツールが、脆弱性の発見や悪用のハードルを下げることを認め、さらに、統制なしで同様の能力が広がった場合に差し迫って生じうるリスクとして、国家主体(state actors)、中国、イラン、北朝鮮、ロシア、ならびに犯罪グループを挙げました。守る側(defenders)が技術を完全に統合するまでの、移行期の混乱期間があると説明しています。

Anthropicは、今後のClaude Opusのリリースには危険なサイバーセキュリティ出力を検知してブロックするためのセーフガードが含まれると述べ、精査済みのセキュリティ専門家向けにCyber Verification Programを導入する計画です。パートナーの調査結果とパッチが当たった脆弱性に関する公開レポートは、90日以内に期待されています。

免責事項:このページの情報は第三者から提供される場合があり、Gateの見解または意見を代表するものではありません。このページに表示される内容は参考情報のみであり、いかなる金融、投資、または法律上の助言を構成するものではありません。Gateは情報の正確性または完全性を保証せず、当該情報の利用に起因するいかなる損失についても責任を負いません。仮想資産への投資は高いリスクを伴い、大きな価格変動の影響を受けます。投資元本の全額を失う可能性があります。関連するリスクを十分に理解したうえで、ご自身の財務状況およびリスク許容度に基づき慎重に判断してください。詳細は免責事項をご参照ください。
コメント
0/400
コメントなし