Anthropic、Project Glasswingで競合と協力しAIのサイバー防御を検証 — Claude Mythos Previewを活用
2026.04.07
・
Wired
AIZEN NEWS編集部の要点整理
AI研究所Anthropicは「Project Glasswing」を発表し、AppleやGoogleを含む45社超と連携してAIのサイバーセキュリティ能力を試験する枠組みを立ち上げました。検証には新しいモデル「Claude Mythos Preview」が用いられ、攻撃や悪用に対する防御・検出能力の評価を目的としています。競合する企業が共同でテストを行う点が特徴です。
この取り組みは、生成AIの高度化に伴う攻撃手法や誤用リスクに対処するための実務的な試験場を提供するものです。複数企業が同じモデルやシナリオで評価を行えば、脆弱性の再現性や対策の有効性を比較でき、製品レベルでの修正や標準化につながる可能性があります。
業界への示唆としては、横断的なレッドチーミングや共同検証が、AIリスク管理の実効性を高める手段になり得る点が挙げられます。一方で、テストの範囲や手法、結果の公開方法次第では、競争上・プライバシー上の配慮が必要になるため、透明性と機密管理のバランスが今後の課題となるでしょう。現時点での成果や具体的な対策内容は公表されておらず、今後の報告が注目されます。