KDDIは2月19日、クラウド環境上の音声通話やデータ通信、決済サービスなどで発生した障害の原因を即時に特定する「復旧支援AIエージェント」の運用を開始したと発表した。複数のシステムが関連する複雑な障害への対応を迅速化し、通信サービスの品質向上と安定を図る。また、2026年度中に復旧措置までを自動化する仕組みを整え、ネットワーク運用の完全自動化を目指すとしている。
KDDIは2021年から、多様なサービスを統合的に監視し、一部の復旧作業をワンタッチや自動で実行する「スマートオペレーション」に取り組んできた。これにより単体システムでの障害復旧は迅速化されたものの、複数のシステムにまたがる複雑な障害については、原因の特定や設備の状態復旧に依然として多くの時間と人手を要していた。こうした背景から、スマートオペレーションをさらに進化させ、初動対応の大幅な効率化を図るためにAIエージェントの導入を決定したという。
今回運用を開始した復旧支援AIエージェントは、サービスやシステム構成の情報を構造化した「運用向けデジタルツイン」を活用する。障害を検知すると、各システムが提供する機能がどのような役割であるかを定量化してデジタルツイン上で相関関係を分析し、膨大な設備アラームの中から、障害の起点となった可能性が高いシステムを即時に特定する。
さらに、設備の稼働状況やメンテナンス作業の実施状況など、複数の情報を統合的に分析することで原因特定の精度を高めている。AIエージェントが特定した原因を運用担当者に提示することで、従来は困難だった複雑な障害の切り分け作業を容易にし、復旧に向けた意思決定を強力に支援するという。
KDDIは復旧支援AIエージェントの導入に加え、2026年度には設備の切り離しや故障部位の交換時に必要な保全作業を実行する役割を担う「保全AIエージェント」の導入も計画している。これら二つのAIエージェントを連携させることで、障害検知から原因の特定、そして具体的な復旧措置に至るまでの一連の工程を完全に自動化する運用体制の構築を視野に入れている。