Azure Proactive Resiliency Library v2
Tools Glossary GitHub GitHub Issues Toggle Dark/Light/Auto mode Toggle Dark/Light/Auto mode Toggle Dark/Light/Auto mode Back to homepage

Reliability

This section contains all recommendations from the Azure Well-Architected Framework’s Reliability pillar.

Summary

RecommendationImpactCategoryPG Verified
RE:01 ビジネス目標に合わせてワークロードを設計するMediumOther Best PracticesVerified
RE:02 ユーザーとシステムのフローを特定して評価するMediumHigh AvailabilityVerified
RE:03 故障モード分析を使用して潜在的な故障を特定し、優先順位を付けるMediumOther Best PracticesVerified
RE:04 信頼性と回復目標を定義するMediumHigh AvailabilityVerified
RE:05 冗長性を考慮した設計MediumHigh AvailabilityVerified
RE:05 マルチリージョンの高可用性のための設計MediumHigh AvailabilityVerified
RE:05 アベイラビリティ ゾーンによる高可用性の設計MediumHigh AvailabilityVerified
RE:06 データパーティショニングの設計MediumHigh AvailabilityVerified
RE:06 信頼性の高いスケーリングのための設計MediumScalabilityVerified
RE:07 バックグラウンドジョブを使用するMediumOther Best PracticesVerified
RE:07 自己保存と自己修復の措置を講じるMediumHigh AvailabilityVerified
RE:07 一時的な障害を処理するMediumHigh AvailabilityVerified
RE:08 信頼性テスト戦略を設計するMediumOther Best PracticesVerified
RE:09 事業継続および災害復旧計画の実施MediumDisaster RecoveryVerified
RE:10 信頼性の高い監視およびアラート戦略を設計するMediumMonitoring and AlertingVerified

Details


RE:01 ビジネス目標に合わせてワークロードを設計する

Impact:  Medium Category:  Other Best Practices PG Verified:  Verified

Description:

ビジネス目標に合わせてワークロードを設計し、不必要な複雑さやオーバーヘッドを回避します。実用的でバランスの取れたアプローチを使用して、望ましい結果をもたらす設計上の決定を下します。非効率性や潜在的な問題を軽減するために、必要なものを設計に含めます。

Potential Benefits:

Meet business requirements
Learn More:
RE:01 Simplicity and efficiency


RE:02 ユーザーとシステムのフローを特定して評価する

Impact:  Medium Category:  High Availability PG Verified:  Verified

Description:

ユーザーとシステムのフローを特定して評価します。ビジネス要件に基づいた重要度スケールを使用して、フローに優先順位を付けます。

Potential Benefits:

Align architecture with reliability goals
Learn More:
RE:02 Critical flows


RE:03 故障モード分析を使用して潜在的な故障を特定し、優先順位を付ける

Impact:  Medium Category:  Other Best Practices PG Verified:  Verified

Description:

障害モード分析 (FMA) を使用して、ソリューション コンポーネントの潜在的な障害を特定し、優先順位を付けます。 FMA を実行すると、各障害モードのリスクと影響を評価できます。ワークロードがどのように応答して回復するかを判断します。

Potential Benefits:

Reduce risk of unpredicted behavior
Learn More:
RE:03 Failure mode analysis


RE:04 信頼性と回復目標を定義する

Impact:  Medium Category:  High Availability PG Verified:  Verified

Description:

コンポーネント、フロー、ソリューション全体の信頼性と回復の目標を定義します。定義されたターゲットを使用して健康モデルを構築します。健康モデルは、健康な状態、劣化した状態、および不健康な状態がどのようなものであるかを定義します。

Potential Benefits:

Communicate reliability expectations with stakeholders
Learn More:
RE:04 Target metrics


RE:05 冗長性を考慮した設計

Impact:  Medium Category:  High Availability PG Verified:  Verified

Description:

特に重要なフローに対して、さまざまなレベルで冗長性を追加します。特定された信頼性目標に従って、コンピューティング、データ、ネットワーク、その他のインフラストラクチャ層に冗長性を適用します。

Potential Benefits:

Optimize for resiliency
Learn More:
RE:05 Redundancy


RE:05 マルチリージョンの高可用性のための設計

Impact:  Medium Category:  High Availability PG Verified:  Verified

Description:

高可用性は、信頼性を考慮した設計の基本原則です。高可用性アーキテクチャは、ダウンタイムを可能な限り回避し、ダウンタイムが発生した場合に効率的に回復するのに役立ちます。

Potential Benefits:

Minimize downtime from regional outages
Learn More:
RE:05 High-availability multi-region design


RE:05 アベイラビリティ ゾーンによる高可用性の設計

Impact:  Medium Category:  High Availability PG Verified:  Verified

Description:

高可用性は、信頼性を考慮した設計の基本原則です。高可用性アーキテクチャは、ダウンタイムを可能な限り回避し、ダウンタイムが発生した場合に効率的に回復するのに役立ちます。

Potential Benefits:

Minimize downtime from zonal outages
Learn More:
Regions and availability zones


RE:06 データパーティショニングの設計

Impact:  Medium Category:  High Availability PG Verified:  Verified

Description:

データをパーティショニングすると、スケーラビリティが向上し、競合が減少し、パフォーマンスが最適化されます。データパーティショニングを実装して、使用パターンごとにデータを分割します。

Potential Benefits:

Improve data estate reliability
Learn More:
RE:06 Data partitioning


RE:06 信頼性の高いスケーリングのための設計

Impact:  Medium Category:  Scalability PG Verified:  Verified

Description:

アプリケーション、データ、インフラストラクチャのレベルでタイムリーで信頼性の高いスケーリング戦略を実装します。

Potential Benefits:

Dynamically handle increased load
Learn More:
RE:06 Scaling


RE:07 バックグラウンドジョブを使用する

Impact:  Medium Category:  Other Best Practices PG Verified:  Verified

Description:

バックグラウンド ジョブは、アプリケーション UI の負荷を最小限に抑えるのに役立ち、可用性が向上し、対話型の応答時間が短縮されます。

Potential Benefits:

Minimize application load
Learn More:
RE:07 Background jobs


RE:07 自己保存と自己修復の措置を講じる

Impact:  Medium Category:  High Availability PG Verified:  Verified

Description:

自己保存および自己修復手段を実装することで、ワークロードの回復力と回復可能性を強化します。自己修復機能は、さまざまなタイプの障害に対応する障害検出と自動修正アクションを組み込むことで、ダウンタイムを回避するのに役立ちます。

Potential Benefits:

Reduce the likelihood of outages
Learn More:
RE:07 Self-preservation


RE:07 一時的な障害を処理する

Impact:  Medium Category:  High Availability PG Verified:  Verified

Description:

インフラストラクチャベースの信頼性パターンとソフトウェアベースの設計パターンを使用して、コンポーネントの障害や一時的なエラーに対処する機能をソリューションに組み込みます。

Potential Benefits:

Reduce the likelihood of outages
Learn More:
RE:07 Transient faults


RE:08 信頼性テスト戦略を設計する

Impact:  Medium Category:  Other Best Practices PG Verified:  Verified

Description:

カオス エンジニアリングの原則をテスト環境と運用環境に適用して、回復力と可用性のシナリオをテストします。テストを使用して、アクティブな誤動作とシミュレートされた負荷テストを実行することで、グレースフル デグラデーションの実装とスケーリング戦略が効果的であることを確認します。

Potential Benefits:

Validate and optimize workload reliability
Learn More:
RE:08 Testing


RE:09 事業継続および災害復旧計画の実施

Impact:  Medium Category:  Disaster Recovery PG Verified:  Verified

Description:

復旧目標に沿った、構造化、テスト、文書化された事業継続および災害復旧 (BCDR) 計画を実装します。計画は、すべてのコンポーネントとシステム全体をカバーする必要があります。

Potential Benefits:

Reliable disaster recovery
Learn More:
RE:09 Disaster recovery


RE:10 信頼性の高い監視およびアラート戦略を設計する

Impact:  Medium Category:  Monitoring and Alerting PG Verified:  Verified

Description:

ソリューションの健全性指標を測定して公開します。稼働時間やその他の信頼性データをワークロード全体から、また個々のコンポーネントや主要なフローからも継続的に取得します。

Potential Benefits:

Observability into workload health
Learn More:
RE:10 Monitoring and alerting