syunブログ

主に資格取得や学習の記録を中心に投稿しています。

SM-H21PM2Q3事前予防的な問題管理について

論文演習4本目。
3時間くらいかかってる。まだ小難しく考えがちで、何を書くか悩むのに時間を取られすぎだ。

                                                                                            • -

■サービス又はシステムの名称
生命保険サービス業のイントラネットシステム

■対象とする企業・期間
?企業・機関などの種類・業種
7. サービス業

?企業・機関などの規模
3.301 〜 1,000 人

?対象業務の領域
3. 営業・販売 4. 生産 5. 物流

■システムの構成
?システムの形態と規模
1. クライアントサーバシステム ア. (サーバ約 30台、クライアント約 1000台)

?ネットワークの範囲
2. 同一企業・同一機関の複数事業所間

?システムの利用者数
5. 301 人〜 1,000 人

■システム運用の規模・形態など
?運用管理及びオペレーション要員数
1.(約 10人)

?運用対象の区分
1.他社システムの運用受託

?運用開始年月
1.(2001年 4月)

■ITサービスマネジメントにおけるあなたの立場
?あなたが所属する企業・機関など
1. ソフトウェア業・情報処理・提供サービス業など

?あなたの担当業務
1. システム管理 2. システム運用

?あなたの役割
1. 部門マネージャ

?あなたの担当期間(2005年 5月)〜( 年 月)

                                                                                            • -

(設問ア)800字以内
1.ITサービスの概要と変更管理プロセス
1.1.私が携わったITサービスの概要
 私が携わったITサービスは、通信教育サービスを行うA社のイントラネットシステム運用である。A社は全国に10ヶ所の支社を展開し、約1000名の従業員がメールやインターネット、グループウェアなどのサブシステムを利用する。
 このイントラネットシステムは、サーバ約30台、ファイアウォールやルータなどのネットワーク機器は約150台により構成され、24時間365日の稼動を行っている。
 私はA社の情報システム子会社に勤務するITサービスマネージャで、このイントラネットシステムに関する利用者からの変更要求対応や機器の監視、故障対応などを主な業務として管理している。
1.2.インシデントの発生傾向と頻度
 私が改善をしたインシデントは、支社のLANに使っているHUBの電源抜けによるノードダウンのアラームである。私がこの業務を担当した当初、インシデント対応の工数が増加傾向にあり、業務の効率化を目的に監視アラームの発生状況を分析をしたところ、このインシデントが発生頻度、対応工数ともにもっとも多いことが判明した。
 支社に設置しているHUBは、故障をすると複数の利用者がシステムを利用できなくなるため、監視サーバによる死活監視を行っている。しかし、全国に約100台が設置されているHUBの監視は、原因の調査、対応に多大な労力を要していた。
 アラームの発生頻度は平均すると一日一回発生しており、夜間の20時から22時頃に約8割が発生していることがわかった。このインシデントには担当者が約30分程度の工数を必要としており、年間にすると約120時間を要していた。

(設問イ)800字以上1600字以内
2.インシデントの考察と対策
2.1.問題を発見するための考察
 事前予防的な問題管理にあたっては、発生しているインシデントの根本原因を掘り下げて考察することで、適切な対策を検討することが重要である。今回のインシデントではHUBのダウンであるが、機器の問題であれば機器の交換を、利用方法の問題であれば運用方法の改善と、アプローチは異なってくる。
 そのため、私はまずインシデントの原因を要因ごとに集計することにした。過去のインシデントは全て担当者が切り分けた結果を記録しているため、その内容を機器の故障、利用者のミス、停電などに分類し、カテゴリごとの集計を行った。
 その結果、発生要因としては利用者のミスによる電源断が最も発生率が高く、約7割を占めていることがわかった。更に要因を掘り下げて分析するため、支社内のLAN環境に誤って電源を切ってしまう要因がないか検証をしたところ、電源コンセントに様々な機器が乱雑に刺さっているケースが多いことがわかった。
 利用者が業務を終えて帰社する際に、誤って電源ケーブルを抜いてしまうケースが多いと想定された。私は、この状況を改善することでインシデント発生を減らし、業務の改善を行うことができると考えた。
2.2.発見した問題を解決するための対策
 このようにして考察を深め、原因を掘り下げることにより、効率的な対策方法を検討することができる。今回のケースでは利用者の環境を要因として誤って電源を切っていたため、対策としては環境の改善と、利用者の誤まりを減らすようにすればよい。
 具体的には、まず環境として電源ケーブスを抜いてしまわないように、HUBの電源ケーブスには注意書きを記したビニールテープを巻きつけ、ほかの電源ケーブルと判別しやすいようにした。この対応は、全国の支社で現地の対応を必要とするため、他のシステム対応で現地へ行く際に、システム担当者が行うこととした。
 また、利用者へ注意を促すため、グループウェアのユーザーサポートのページを利用して、HUBの電源を抜かないように発信を行った。
 上記のような対策を行った結果、HUBのノードダウンによるアラームのインシデントは目に見えて削減された。一年後に再集計を行ったところ、改善前は一日に一件であったが、一週間に一件程度になっていた。工数にすると年で約100時間の削減効果である。

(設問ウ)600字以上1200字以内
3.問題管理を定着させるための取組と今後の改善点
3.1.問題管理を定着させるために行った取組
 今回あげた事前予防の活動は、私が業務改善のために行った、いわばプロジェクト活動ともいえる取組の成果である。しかし、ITサービスを長期的に健全に保つためには、問題が発生してからの対応を行うだけではなく、プロアクティブな活動として、事前予防的な問題管理を取り入れ、PDCAのライフサイクルで活動を行うことが必要である。
 そのため、今回の私が行ったようなインシデント集計と分析のプロセスをモデルとし、年に一度の業務として取り入れることにした。毎年、インシデント発生要因を集計・分析し、多くの工数を取られているインシデントに対して対策を検討する。
 このようにすることで、インシデントの対応を行うだけではなく、インシデントが発生しないようにすることを義務付けたのである。
3.2.今後改善すべき点
 現在は、インシデントのみを事前予防検討の対象としているが、いま目に見えている問題や、自部門のことだけを考えるのではなく、ITサービス全体の効率化や、利用者にとって更に安全、かつ利便性の高いサービスを提供していくため、顧客の意見も取り入れた活動を行っていきたいと考えている。
 具体的には、サービスデスクへ寄せられた利用者からの問い合わせを分析することや、顧客との意見交換会を定期的に行うなどの取組を行っていきたいと考えている。
 利用者へのより良いITサービス提供のため、広い視野を持ち、利用者の立場でITサービスの活動を改善していきたい。
−以上−