みなさん、こんばんわ。
僕がプログラマーだったことの話なんです。
作ったプログラムをスケジュールに従い実行管理するのが、オペレーション担当者です。
僕はかつて見たことや聞いたことがない事態に遭遇しました。
オペミスがとても多い担当者がいました。
まあ、どれくらいで多いかとするかは、基準が必要ですけれども、このころはまだそんな基準もなくて、他の人と比べてていうことでしたけれど。
仮にこの担当者をAさんとしましょう。
皆さんどんなミスをすると思いますか?
ちょっと、書いてみましょう。
①二重処理の多発 同じジョブを2回以上実行する
②①の影響でジョブによっては、データが実行回数分だけ倍増、もしくは大事なデータを消去してしまう。
③①と②によって、得意先様からクレームの電話が入る。
④Aさんが上司に怒られる
⑤原因を聞かれても憶えていない。
⑥反省の言葉がない
⑦最後にはコンピュータが間違えたと開き直り
⑧当時のコンピュータログでは、誰がいるジョブを何回実行したのかわかりせんでした。また、調査に非常に多くの時間が必要でした。
⑨このようなサイクルでミスが起きるので人間関係も最悪でした。
本人も気の毒でしたね。自分では一生懸命働いていると思っているのですから。
さて、みなさん、100万分率という言葉をご存じでようか。※間違っていたらごめんなさい。
かつて読んだ本に載っていました。題名は記憶にありませんが、たしか飛行機の事故率の指標だったと思います。この数値が小さいほど安全性が高いと言われています。
また、その本には事故というものは、ヒューマンエラーが大半を占めると書いてありました。
僕は考えました、どうしたら、オペミスを防止できるか、実行履歴を見ることができるかと。
指導もむなしく、反省も役にただず、人だけに頼るのは止めようと思うようになりました。
最終的に、ジョブ実行管理システムというものを手作りするに至りました。
どんな機能かといいますと、
①ジョブの二重処理防止機能 更新系は、同じジョブを2回できなくする
②ジョブの実行記録を書き出す 誰が、いつ(日時)、どんなジョブ(ジョブ名)、
正常終了か、否か、データ処理件数が何件か
③二重処理防止機能の一時解除機能 必要に応じて2回処理できるようにする
ざっと、こんな感じになります。
この開発と導入には3か月ほど掛かりましたが、オペミスの発生率は下がりました。
これは、人の質を改善したのではありません。機械に人のミスを防止する機能を
手作りで導入したわけです。
車で言えば、衝突防止機能みたいなものでしょうか。
どうしても、コンピュータのOSに付属する機能では、満足できる結果が得られない時、手作りするのもひとつの方法ではないかと思います。
この時作った、ジョブ実行管理システムは、機械の入れ替えによって過去のものと
なりましたが、僕自身は非常に満足できる機能だったと思っています。
システム開発者や運用責任者の方、参考にしていただければ幸いです。
なるほど! これでわかった 図解 よくわかる これからのヒューマンエラー対策 (DOBOOKS)