ブログ

applicationヘルス測定の調整の重要性

ロリ・マクヴィッティ サムネイル
ロリ・マクヴィッティ
2020年5月11日公開

最近、サンゴの飼育の世界に再び戻ったとき、測定値の校正の重要性を思い出しました。 application環境の急速な変化と同様に、サンゴの飼育も過去 5 年間で劇的に変化しました。 

今では、接続されたモニターとプローブによって、何か異常があった場合に自動的に追跡して警告を発してくれるようになりました。 Web およびモバイル ダッシュボードを使用すると、タンクの状態やタンクを稼働させる多数のデバイスの状態を監視、プログラミングし、一目で確認することができます。 

賢明な読者は、PH が「最小値を下回っている」ように見えることに気付くでしょう。 心配する必要はありません、すべて順調です。 プローブ(センサー)が適切に調整されていないことがわかります。 これはよくある問題です。プローブの調整は失敗の多いプロセスです。 現時点では、プローブが低く校正されていることがわかっており、その知識に基づいて測定値を自動的に調整します。 

サンゴ礁の水槽の健全性と同様に、applicationsの健全性には主要な指標への細心の注意が必要です。 逸脱、特に激しい変動は、問題を示している可能性があります。 applicationsに関しては、メトリックの手動調整は模倣したいプロセスではありません。 手動調整は 1 つまたは 2 つのapplicationでは機能するかもしれませんが、平均的な組織ではデジタル ポートフォリオに 100 ~ 200 のapplicationsがあります。 一般的な健康パターンに合わせて調整された正確な測定値が必要です。

ほとんどのネットワークおよびapplicationメトリックと同様に、これは一定期間サンプルを取得し、「高値」と「安値」を把握することを意味します。 しきい値を使用して異常な動作を判断できます。

問題は原則ではなく、実行です。

まず、私たちは通常、applicationという 1 つの測定ポイントのみに焦点を当てています。 興味深いことに、サンゴ礁の水槽の健康状態を確認するには、温度とともに塩分濃度と pH を測定する必要があります。これは、両方の値が温度の影響を受けるためです。 applicationの健全性の測定もほぼ同じで、ネットワークのパフォーマンスや負荷など、他の指標の影響を受けます。 残念ながら、ほとんどの組織は必ずしもapplicationの健全性を総合的に捉えているわけではありません。 application自体は問題ないかもしれませんが、接続されたデバイスやネットワークのパフォーマンスが低いために、顧客エクスペリエンスが最悪になる可能性があります。 

測定対象を拡大することで、applicationの健全性に対する視野を広げる必要があります。 さらに、何が典型的で何がそうでないかを確実に識別できるように、追加の測定値を調整する必要があります。 なぜなら、「典型的でないもの」は、問題や、さらに悪いことに、攻撃の兆候である可能性があるからです。

2 番目に、規模の課題は、監視する必要のあるすべてのapplication(ネタバレ: すべてです) について、複数のポイントにわたって調整する必要があることから生じます。 オペレーターがこれほど多くのデータポイントを手動で調整することは期待できません。 それは人間には不可能だ。

そこで機械の出番です。

高度な分析

高度な分析と機械学習は、規模の問題に対する答えの 1 つです。 マシンは膨大な量のテレメトリをかなりの速度で処理できますし、実際に処理しています。 人間が管理できないほどの大量のデータからパターンや関係性を取り込み、正規化し、分析することができます。 このように、機械学習は、関連するさまざまなデータ ポイントにわたって「正常」を調整し、問題を示す異常なパターンを即座に検出する機能を提供します。

applicationのパフォーマンスの問題と月曜日の朝のログインの急増を関連付けるのは簡単です。 簡単ではないのは、ボブが通常月曜日の午後までログインしないことを認識することです。 しかし、今日、彼はそうなのです。 それは、そのレベルの可視性がないため、人間のオペレーターが容易に認識できない異常です。 コードから顧客までのエクスペリエンスを構成するapplication、クライアント、およびapplicationサービスによって十分なテレメトリが送信されると、高度な分析によってその異常を検出できます。 また、フラグを立てたり、ボブが実際にログインしようとしていることを確認する新しいビジネス フローをプッシュしたりすることもできます。

この機能は、現在多くのapplicationsがデバイス レベルで実行している機能と似ています。 多くのデジタルプロセスでは、検証コードをプッシュし、ぼやけた画像内のすべての車を識別することで人間であることを証明するように求めます。 しかし、新しいビジネス フローをトリガーするのはデバイスの詳細であり、通常とは異なる時間にログインする動作ではありません。 将来的には、特に分散した労働力を継続的にサポートする場合は、両方に基づいてフローをトリガーできる必要があります。

そのため、キャリブレーションはプロセスの重要な部分になります。 そして、校正は(多数の)測定を行って「標準」を導き出すことによって達成されます。 これもまた、人間のスケールに挑戦するプロセスであり、大量のテレメトリを取り込んで分析するために機械を必要とします。

高度な分析により、最終的には可観測性が実現され、隠れたapplicationの洞察 (DEM) を明らかにし、よりスマートなアプリ サービスのオーケストレーション (AI Ops) を可能にし、これまで発見できなかったビジネス価値 (AI 拡張サービス) を生み出す新しいサービスが生まれます。

そのためには、applications、ユーザー、およびその間のデータ パスにあるすべてのものの「通常の」動作を調整できるように、大量のテレメトリを生成する必要があります。