信頼性設計技法について

信頼性設計技法とは

信頼性とは

信頼性とは、システムが正常に稼働し、サービスを提供し続けられるかを計るための指標のことです。
信頼性が高いシステムとは、システムの故障や障害が起きにくいシステムのことをいいます。


RASIS(ラシス、レイシス)

RASISは、システムの信頼性を評価する指標です。
この概念は、1970年代にIBMが製品の評価指標として提唱した「RAS = Reliability, Avalability, Serviceability」が由来となっています。
日本では、RASに完全性と機密性を加えた「RASIS」がシステム全般の評価指標として広く使われるようになっています。

  • Reliability(信頼性)
    • 障害や不具合による停止や性能低下の発生しにくさを示す。
  • Availability(可用性)
    • 稼働率の高さや作業による停止時間の短さを示す。
  • Serviceability(保守性)
    • 障害からの復旧時間の短さやメンテナンスのしやすさを示す。
  • Integrity(完全性)
    • データの消失や不整合などの発生のしにくさを示す。
  • Security(機密性)
    • 外部からの攻撃や改ざんなどのセキュリティへの強さを示す。

信頼性指標・稼働率指標

MTBF(Mean Time Between Failures:平均故障間隔)

MTBFは稼働開始から次に故障するまでの平均稼働時間を指します。


MTBF = (総稼働時間)/(総故障回数)

MTTR (Mean Time To Recovery:平均修復時間)

MTTRは、故障から復旧までにかかった時間の平均を指します。


MTTR = (総故障時間)/(総故障回数)

稼働率(Operating Ratio)

稼働率はシステムなどの全運転時間に対する稼働時間の割合で定義されます。


稼働率 = MTBF / (MTBF + MTTR) = 総稼働時間 / (総稼働時間+総故障時間)

バスタブ曲線

バスタブ曲線とは、故障率曲線のことです。
故障率曲線は、初期の故障率が高く、一定期間ののち、経過年数でまた故障率が上がるため、バスタブのような形をしたグラフとなります。


複数システムの稼働率

複数システムの稼働率を計算する場合、直列システムと並列システムでそれぞれ以下の計算方法となります。


直列システムの稼働率 = システムAの稼働率 × システムBの稼働率
並列システムの稼働率 = 1 - (1 - システムAの稼働率) × (1 - システムBの稼働率)

システムの信頼性設計について

フェールセーフ(Fail-Safe)

フェールセーフとは、故障が生じてもシステムに重大な影響が出ないように、あらかじめ定められた安全状態にシステムを固定し、全体として安全が維持されるような設計手法です。
和訳すると「失敗時の安全」という意味になります。

フェールセーフは、システムに障害が発生したら、安全性を最優先にしてシステムを停止します。
例えば、以下がフェールセーフの例です。
・故障すると暴走する前に停止する車
・倒れたら火が消える暖房機器


フェールソフト(Fail-Soft)

フェールソフトとは、障害が発生したときに多少の機能制限や性能低下を許容しつつ、システム全体の運転継続に必要な機能を維持しようする設計手法です。
和訳すると「失敗時の安全」という意味になります。

フェールソフトは、システムに障害が発生したら、システム全体を止めずに一部の機能を切り離して稼働させ続けます。
例えば、以下がフェールソフトの例です。
・停電時にバッテリ駆動に切り替わるUPSを使用して、一部の機能だけを優先してシステムを継続すること。
・スカイダイビングにおいてパラシュートをメインとリザーブ(予備)の2つ装備していること。
・航空機(商業旅客機)に複数のエンジンを備えて、緊急時は近くの空港まで単機でも飛べるようにしていること。


フォールトトレランス(Fault-Torelance)

フォールトトレランスとは、故障が発生した場合でも機能を縮退させることなく稼動を継続する概念です。
和訳すると「故障に耐える」という意味になります

フォールトトレランスは システム停止によって生命の危機に瀕したり、生活に支障をきたすものに対して用いられます。
・停電すると発電機が起動して電力を供給させ続ける病院などの施設。
・予備の電源系統を用意して電源装置を二重化し、片方が故障しても電源が落ちないサーバシステム。

フェールソフトは一部の機能を制限してシステムを継続するという概念です。
これに対して、フォールトトレランスは機能を切り離さずに全てのシステムを正常に稼働し続けるという概念です。


フォールトアボイダンス(Fault-Avoidance)

フォールトアボイダンスとは、システム構成要素の個々の品質を高めて故障が発生しないようにする概念です。
和訳すると「故障を回避する」という意味になります。

フォールトアボイダンスは、故障そのものを回避するために障害自体が起きにくいように設計するという考え方です。
フォールトアボイダンスの方法としては、以下の例が挙げられます。
・高信頼部品の採用
・テストや検証による良品選別、品質保証・品質管理体制の整備
・高信頼化設計・保護設計の導入
・作業者に対する教育・訓練、作業手順に対する工夫

フォールトトレランスは、問題が起きたらどうするか?という考え方です。
フォールトアボイダンスは、問題を起こさないためにどうするか?という考え方です。


フールプルーフ(Fool-Proof)

フールプルーフとは、ユーザーの誤操作によってシステムがダウンしてしまうことのないように、単純なミスを発生させないようにする設計方法です。
和訳すると「愚か者に耐える」という意味になります。愚か者とはシステムを操作する人やオペレーターを指しています。

フールプルーフは、利用者が誤った操作をしても,システムに異常が起こらないようにする考え方です。
・蓋を閉めないと回らない洗濯機
・2つ設けておき、両方を同時に押さないと作動しない機械のスイッチ
・ドアを閉めないと起動しない電子レンジ
・名前の似ている薬剤を間違えて使用しないように別の場所に保管すること


関連ページ