2019-08-14

ACALLサーバーの障害解決のお知らせとご報告

ACALL サーバー障害に関するご報告

平素よりACALLをご利用いただき、誠にありがとうございます。

2019年8月14日、ACALLのクラウドサーバーが高負荷の状態になり、
お客様のアクセスに対する遅延・不安定な挙動や一時停止する状況が発生いたしました。
今回の障害により、ご利用中のお客様には大変ご迷惑をおかけいたしました。謹んでお詫び申し上げます。

本障害について、以下ご報告いたします。

■障害発生日時
2019年8月14日(水)
13:06 サーバーが高負荷状態になっており、サービスが正常に動作していない状況を確認し、調査開始
13:35 大量のエラーログファイルがサーバーのディスク容量を圧迫し、サーバー高負荷につながっていることを確認
13:37 エラーログファイルを削除するが、不安定な状態が継続していることを確認
14:20 エラーの原因となっている箇所に修正を行い、修正をリリース
14:30 サーバーの負荷状況を経過観察し、正常動作していることを確認

■障害内容
ACALLクラウドサーバーにて一部のエラー処理ロジックに不備があり、
それに伴い短時間で大量のエラーログファイルがサーバー上で生成されていました。
大量に生成されたエラーログファイルによるディスク容量圧迫と、
エラーログ出力負荷に伴うアプリケーションの動作不安定が原因となり、
サービスのレスポンスが低下する状態になっていました。

■障害対策
該当のエラー処理ロジックを修正し、本事象に対する対策としました。

■今後の方針
コードレビューやテスト体制を見直し再発を防止すると共に、
インシデント発生時の業務フローを改善し、障害時情報発信体制の強化を行います。

ご迷惑をおかけいたしましたこと、深くお詫び申し上げます。
何卒ご了承いただけますようお願い申し上げます。

(履歴)

8月14日、ACALLサービスサーバーの不安定によりACALLサービスが一時的に利用できなくなる事象が発生致しました。

ご迷惑をおかけしてしまい、誠に申し訳ございません。

8月14日14時20分過ぎに復旧の対応を行い、現在サービスは正常にご利用頂ける状態です。

サーバーを安定させるために、引き続き調査と対応をして参ります。

ご迷惑をおかけしましたこと、改めて深くお詫び申し上げます。

ちょっと質問したい

ささやかなご質問から、
お気軽にお送りください。