東京ガスは、ガスや電気の受付システム「TG-WISP」の安定運用と信頼性向上を目的に、New Relicのオブザーバビリティプラットフォーム「New Relic」を採用した。3月10日、New Relicが発表した。月間最大300万件のリクエストを処理するシステムの稼働状況を可視化することで、エラー調査に要する時間を従来の10分の1に短縮した。今後はトラブルの予兆検知によるプロアクティブな対応も目指す。
東京ガスは、首都圏を中心に都市ガスや電力を供給する国内最大の都市ガス事業者だ。2026年1月時点でのガス・電気の契約延べ件数は約1300万件に達している。同社が運用するTG-WISPは、Web経由での使用開始・停止手続きを担う重要なライフラインの入口であり、1日平均1万2000名が利用している。特に2月から4月の繁忙期にはアクセスが集中し、1日あたりの受付数は10万件、月間では最大300万件に及ぶ。
当初、TG-WISPはオンプレミス環境で稼働する小規模なシステムだったが、利用者数と機能の拡大に伴い、2022年にインフラをMicrosoft Azureへ移行した。システムが大規模化し、APIを通じた外部連携も複雑になる中で、24時間365日の安定稼働と良好なユーザー体験を維持することが課題となっていた。異常やその兆候を早期にとらえ、迅速に対応できる環境を構築するため、同社はオブザーバビリティの導入を決めた。
製品の選定にあたっては、インフラからアプリケーション、ユーザー体験までを単一のプラットフォームで監視できるフルスタックな機能を評価した。機能ごとの課金ではない料金体系により、コストを抑えつつ必要な機能を順次追加できる点も決め手となった。また、Infrastructure as Code(IaC)ツールとの親和性が高く、ダッシュボードのテンプレートを他システムへ横展開しやすい点や、観測結果の視覚的な分かりやすさも評価された。
導入にあたり、東京ガスと運用を担う東京ガスiネット、開発を担うサーバーフリーの3社による共同のDevOps体制を構築した。2023年から段階的に各機能の検証を進め、本番運用を開始。New Relicの導入後は、1画面のダッシュボードですべてのシステムのログを閲覧できるようになった。これにより、従来は膨大なログ収集と分析を要していたエラー1件あたりの調査時間を約10分の1に短縮した。
組織間の連携も強化された。従来、問題発生時の対応方針決定には3時間程度を要していたが、New Relicのデータを共通言語として3社が即座に協議できる体制に切り替え、約30分で意思決定が可能になった。意思決定のスピードは従来の6倍に向上している。また、トレースIDによる処理の可視化により、インフラ担当者がアプリケーションの問題切り分けに貢献できるようになったほか、リソースの最適化によるクラウドコストの適正化も実現した。
東京ガスエネルギー事業革新部オペレーション改革グループチームリーダーの小川靖史氏は、メインシステムとしてTG-WISPをリリースした直後の繁忙期に、New Relicによる可視化が難局を切り抜ける助けになったと語る。New Relicがあることで稼働に対する大きな安心感を得られており、今後は収集したデータを活用して障害を未然に防ぐプロアクティブな対応を実現したいと考えている。
同社は今回の成功モデルをベースに、New Relicの適用範囲を他のシステムにも拡大していく方針だ。グループ一体となった信頼性向上とプロダクト改善の取り組みを継続し、ライフラインを支えるシステムの安定稼働を追求していく。