【後編】10月の全銀システム送金トラブル、冗長システム設計の課題とは

プロジェクトオーガナイザの吉田聖書よしだみふみです。

12月1日に、一般社団法人 全国銀行資金決済ネットワーク(全銀ネット)とNTTデータが連名でプレスリリースを出しまして、今年10月に一部銀行での送金ができなくなった障害の原因と再発防止策を発表しました。今週は先週の続きをお送りします。

全国銀行データ通信システムの障害について(2023/12/1 一般社団法人 全国銀行資金決済ネットワーク、株式会社NTTデータ)

前回は、プレスリリースに記載されている3つのプロセス(設計・製造工程プロセス、試験工程プロセス、復旧対応プロセス)のうち、試験工程プロセスでの課題に着目しました。今回は復旧対応プロセスの課題に着目したいと思います。

復旧対応プロセスの課題として4点挙げられているんですが、それらの根本にある原因は恐らく「事故はあり得ない」という慢心ではないかと思います。(もしかしたら記者会見の質疑応答でそのようなやり取りがあったかもしれません。)これは私自身も振り返ってみると、あまり偉そうなことは言えない実態があります。

「事故はあり得ない」という想定を置く理由は、単に事故を想定したくないという感情的な楽観論よりは、(もちろんそういう要素もあると思いますが、)事故を想定して対策するとなるとコストと時間がかかるからという現実的な楽観論の方が強いのではないかと私は思います。

正論を言うならば、ちゃんと事故を想定して対策をした場合に余分にかかるコストと、全く対策をしなかった結果発生しうる最悪の事故の後始末にかかるコストを比較して判断するということも考えられますけれども、そもそも最悪の事故の対処にかかるコストの試算そのものに時間もコストもかかるわけです。普通はそんなのやってられないですよね。

それでもちゃんと事故を想定した備えをするインセンティブは何かというと、それはSLA(Service Level Agreement)ではないかと考えます。SLAというのはこういう品質のサービスをこれこれの条件で提供しますっていう顧客との契約です。プレスリリースにはBCP(事業継続計画)については触れられていましたがSLAについては触れられていません。

全銀ネットと各金融機関とがどのような契約を締結していたのか、また、全銀ネットとNTTデータとが運用面でどのような契約を締結していたのかは明らかにされていません。ただ、事故を想定していなかったということは、おそらくSLAも存在していないか、あったとしても表面的なものだった可能性はあります。というのも、SLAで今回のような事故発生時の対応について定められていれば、それに準じた対策をする義務が生じるからです。もしかしたら、そのことを「BCPの実効性不足」という言葉で、プレスリリースの中では表現しているのかもしれません。


※ この記事は、先日公開した以下の音声コンテンツを基に編集したものです。


復旧対応プロセスにおける4つの課題の中に「両系同時障害を想定した訓練が実施できていなかった」というのがあります。これは何かというと、インフラを構築する時に、よく「冗長構成」ということが言われます。それは複数の系統を準備しておいて、片系が故障してももう片系があるからシステム全体として停止しないという発想です。例えば同じ役割のサーバーを複数台並列に設置したり、電源や通信回線を二重化したりといった対策が普通に取られます。

なので、事故を想定する場合は片系の故障は想定しても、両系同時の故障は「まずありえない」と整理して免責にすることがよくあります。でもこの冗長構成というのは、普通はハードウェアやインフラの故障に備えるための対策であって、アプリケーションの異常終了に備えるためのものではありません。全く同じソースコードからコンパイルされた実行モジュールを何台並列に配置したところで、それらは同じ障害を発生させます。

だから、アプリケーションソフトも含めて冗長化するには、同じ仕様に基づいて違う人(あるいはチーム)が作ったプログラムを並列に配置する必要があります。私の記憶が確かであれば、航空機の制御プログラムは、そのようなやり方(1つの仕様に基づいて別のチームが別のモジュールを作る)で三重化されているという話を聞いたことがあります。ほとんどのシステムはそうだと思いますが、その航空機のような方式を取っているのでなければ、両系同時障害を想定せざるを得ないということになります。



関連記事

プロマネの右腕

クロスイデアでは、新サービス・新ビジネスの 立上げや計画を中心に
プロジェクトマネジメントの支援を行っています。

新サービスの企画を任されたけど どう進めていいか悩んでいる担当者、
部下に新しい企画を任せたけど このままで大丈夫か不安な管理職の方、
以下のサイトをご参照ください。
https://www.crossidea.co.jp/services/right-hand-pmo.html

YouTubeにて動画配信中!

プロジェクトマネジメントのノウハウを
YouTubeで配信しています。
ブログと併せてご活用ください。

Comments are closed.