Monitor
The presented Microsoft Azure Well-Architected Framework recommendations in this guidance include Reliability Stage “5 - Monitor (Observability and Monitoring)” and associated resources and their settings.
Ongoing monitoring is essential for maintaining system reliability. Key performance indicators (KPIs) are constantly observed to ensure the system is meeting its defined objectives. Services like Azure Monitor, Network Watcher, and Service Health can be invaluable here.
Summary
Details
アプリケーションの健全性が監視されていることを確認してください
Impact: Medium Category: Monitoring and Alerting PG Verified: Verified
Description:
監視と診断は、可用性と復元力にとって非常に重要です。何かが失敗した場合は、失敗したこと、いつ、なぜ失敗したかを知る必要があります。 監視は障害の検出と同じではありません。たとえば、アプリケーションは一時的なエラーを検出して再試行し、ダウンタイムを回避できます。また、エラー率を監視してアプリケーションの健全性の全体像を把握できるように、再試行操作をログに記録する必要もあります。 キーポイント: - 実用的で効果的に優先順位が付けられたアラートを定義します。 - 制限とクォータに近づいているサービスをポーリングするアラートを作成します。 - アプリケーション インストルメンテーションを使用して、パフォーマンスの異常を検出して解決します。 - 長時間実行プロセスの進行状況を追跡します。 - 問題のトラブルシューティングを行い、アプリケーションの健全性の全体像を把握します。 - 監視されている信号を分析、診断、対応する方法を文書化します。
Potential Benefits:
Enhanced availability and issue tracking
Learn More:
パフォーマンス、可用性、回復目標に基づいて健全性モデルを定義する
Impact: Low Category: Monitoring and Alerting PG Verified: Verified
Description:
正常性モデルは、適切な運用上の優先順位付けが確実に適用されるように、重要なシステム フローまたは主要なサブシステムの正常性を明らかにできる必要があります。 たとえば、正常性モデルは、ユーザーのサインイン トランザクション フローの現在の状態を表現できる必要があります。健全性モデルでは、すべての障害を同じように扱うべきではありません。健全性モデルでは、一時的な障害と非一時的な障害を区別する必要があります。予想される一時的だが回復可能な障害と、真の災害状態を明確に区別する必要があります。 キーポイント: - アプリケーションが正常か異常かを判断する方法を知っています。 - 診断データ内のログの影響を理解します。 - アプリケーション全体で診断設定を一貫して使用できるようにします。 - 健康モデルで重要なシステム フローを使用します。
Potential Benefits:
Enhanced system health insights
Learn More:
Azure プラットフォーム リソースのダッシュボードとアラートを作成する
Impact: Low Category: Monitoring and Alerting PG Verified: Verified
Description:
この段階では、オペレーターが問題や傾向にすぐに気づくことができるように、テレメトリ データが表示されます。 例には、ワークブック、ダッシュボード、電子メール アラートなどがあります。 Azure ワークブックやダッシュボードを使用すると、Application Insights、Log Analytics、Azure Monitor メトリック、およびサービスの正常性から発生する監視グラフの単一ペインのビューを構築できます。 Azure Monitor アラートを使用すると、サービスの正常性とリソースの正常性に関するアラートを作成できます。
Potential Benefits:
Quick issue detection and response
Learn More:
組み込みの復元ポリシーを利用する
Impact: Medium Category: Governance PG Verified: Verified
Description:
Azure の組み込みの復元ポリシーを利用して、Azure サービスの復元構成を監査し、適用します。 Azure Policy は、組織の標準を適用し、大規模なコンプライアンスを評価するのに役立ちます。
Potential Benefits:
Ensures compliance and upscale resilience
Learn More:
ビジネス要件に関連した信頼性を追跡するためのメトリクスを定義する
Impact: Low Category: Monitoring and Alerting PG Verified: Preview
Description:
クラウド ソリューションの信頼性を測定して向上させるには、ソリューションがビジネス要件をどの程度満たしているかを反映する指標を定義する必要があります。たとえば、可用性、遅延、スループット、エラー率、耐久性を指標として使用して、ソリューションのパフォーマンスと信頼性を定量化できます。これらの指標は、SLA や SLO などの信頼性目標の進捗状況を追跡し、改善の余地がある領域を特定するのに役立ちます。また、指標を顧客の期待やフィードバックに合わせて調整し、それらを使用して信頼性への取り組みに優先順位を付ける必要があります。
Potential Benefits:
Performance insights align with business requirements