Claude Mythosを巡る懸念と・・・

アメリカのAI企業アンソロピック（Anthropic）が2026年4月に発表した最新モデル「Claude Mythos（クロード・ミュトス）」を巡る懸念について、最新の動向を整理してみました。

このモデルは、これまでのAIとは一線を画す高い能力を持つ一方で、その強力さゆえに、サイバー兵器になり得るという深刻な指摘がなされています。日本でも政府が日銀やメガバンクなどと会議を開き、対策を進めることで一致したとの報道が、24日に流れています。

Contents

1 懸念されている主な理由
2 異例の対応
3 不正アクセスの発生
4 今後の影響
5 ちなみに

懸念されている主な理由

Claude Mythosがこれほどまでに警戒されているのは、主に以下の3つの能力が突出しているためです。

ゼロデイ脆弱性の自律的な検出と悪用 これまで人間が気づかなかったシステムの欠陥（ゼロデイ）を自ら発見し、それを攻撃するコードを自動で生成する能力があります。
多段階の攻撃プロセスを完結させる能力 単一の攻撃コードを書くだけでなく、侵入から権限奪取、データの持ち出しといった、複数のステップが必要な複雑なサイバー攻撃を、人間の介入なしに数日間分を数分で遂行できるとされています。
各国のセキュリティ機関による警告 イギリスのAI安全研究所のテストでは、提示された32段階の複雑なサイバー攻撃シミュレーションを突破しており、サイバー脅威のレベルを一段階引き上げたと評価されています。

個人的には、どれも「怖い」だけでは片づけられず、一刻も早く軍事利用で使うことを禁止すべきと思います。ただ、防衛なら使えるのでは？と日本の自衛権という意味では検討してしまいそうな懸念も感じます。

異例の対応

アンソロピック自身もこのリスクを重く受け止めており、以下のような異例の措置を取っています。

通常のClaudeシリーズとは異なり、Mythosは一般公開されていません。代わりに「Project Glasswing」という枠組みを通じ、Amazon、Microsoft、Apple、CrowdStrikeといった一部の信頼されたパートナー企業や政府機関にのみ、防御目的での利用に限定して提供されているようです。これは、悪意のあるハッカーが脆弱性を見つける前に、AIを使って自社のシステムを修正させる、防御の先回りを目的としています。

不正アクセスの発生

直近（2026年4月22日頃）では、さらなる深刻な事態が報告されています。

第三者による不正アクセス 限定公開だったはずのClaude Mythos Previewに、外部のグループが不正にアクセスした疑いがあることが判明しました。
流出の経緯 ブルームバーグの報道によると、アンソロピックの業務委託先の環境を介してアクセス権が奪われた可能性があります。現時点では大規模な悪用の証拠は見つかっていませんが、最強のAIを隔離して管理するという同社のセキュリティ体制の限界が露呈した形となりました。

今後の影響

冒頭にも書きましたが、日本国内でも、この事態を受けて金融庁や日本銀行、メガバンクなどが緊急の会議を開くなど、金融システムへの影響が危惧されています。Claude Mythosの登場は、AIによってサイバー攻撃のコストが劇的に下がり、スピードが加速する恐るべき時代の到来を予感してしまうものであり、今後はAIを使った防御体制の構築なども急務となっています。