100 人中、デジタル資産のパフォーマンス、可用性、セキュリティを追跡するために使用する無数の監視ツールから必要な洞察を得ることができているのはわずか 5 人です。
残りの95は? かわいらしいが効果のないベン図を見つめているのと同じかもしれない。
洞察が得られない原因の 1 つは、ツールの不足やデータの不足ではなく、データに継続的に偏りがあることです。
データの偏りは、システム内の主観的なキュレーションによって発生します。 意見に基づくキュレーションは、どのようなデータがどのシステムから収集されるか、ダッシュボードに視覚化をどのように表示するかなど、あらゆることに関して下された決定の結果です。
データ バイアスの最も重大な原因の 1 つは、エージェント ベース システムのレガシーです。エージェント ベース システムでは、データを収集するすべてのシステムに追加のソフトウェアを導入する必要があります。 エージェントは通常、分析プラットフォームとペアになっており、過去にはこれらの製品の価格にエージェントのコストが含まれていることが多かったです。 もちろん、大規模な導入の場合は割引されますが、それでもコストのかかる提案です。
エージェントの導入と管理にかかるコストによって、データを収集できるシステムが制限されるため、データに偏りが生じます。 多くの場合、特定のapplicationまたはシステムを監視する価値に関する意見(経験の有無にかかわらず)が、展開の決定に影響を与えます。
生成されるデータの量も、特定のデータ ポイントの価値に関する意見に基づいた意思決定につながるため、継続的なバイアスの原因となります。 本当にこれらすべてのメトリックが必要ですか、それとも 3 つまたは 4 つに制限できますか? メトリクスを独断的にキュレーションすると、データ全体の変化や推移を検証する方法がなくなります。 こうした変化や推移は潜在的な問題やリスクを示している可能性がありますが、データが重要でないと判断されたために見逃されてしまいます。
最後に、視覚化に関するダッシュボードの決定は解釈にさらなる偏りをもたらし、ダッシュボードを使用する他のユーザーと共有されない可能性のあるスキルと経験に基づいていることがよくあります。 グラフの選択によってもバイアスが生じる可能性があります。 これは、パフォーマンスや稼働時間などの時系列ベースの運用メトリックに特に当てはまります。
棒グラフは時系列データをグラフ化するためによく使用されますが、折れ線グラフほどインパクトはありません。 棒グラフでは、線の形状から何が起こっているかを把握するのではなく、棒の高さを比較して応答時間の変化を理解する必要があります。 これらの単純な決定は、システムの動作状態を把握するために視覚化に依存しているオペレーターに大きな影響を与える可能性があります。
これらすべての決定は、データに継続的に偏りをもたらし、データを解釈する能力、ひいてはそれが実際に何を意味するのかを理解する能力に影響を与えます。
デジタルがデフォルトの世界でより良い意思決定をしたいのであれば、より良いデータが必要となり、それはできる限りデータの偏りを排除することを意味します。
これがOpenTelemetryが非常に有望である理由の 1 つです。 オープンソースの(したがって低コストまたは無料の)エージェントを使用してテレメトリを生成および取り込む方法を標準化することは、データ バイアスの根本的な原因の 1 つである IT 予算を排除するのに大いに役立ちます。 「価値がある」と判断された少数のシステムだけでなく、すべてのシステムからテレメトリを収集できるようにすることで、データ内の偏りの重大な原因を排除できます。 そのため、エッジに関する当社のビジョンには、テレメトリ生成をプラットフォーム自体に組み込むという概念が含まれており、いつでもどこでも利用できるようになります。
サービスとしてのデータ レイクも、時間の経過とともに保存する量とコストによるキュレーションによって生じる偏りに対処する効果的な手段となります。 規模と容量をアウトソーシングすることで、組織はより多くのテレメトリをより自由に取り込むことができ、パフォーマンスなどに影響を与える異常やパターンを発見しやすくなります。 過去 5 年間で、このようなサービスのメニューは増え続けており、IT 予算をますます消費し続けている XaaS カテゴリの一部としてまとめられることが多くなりました。 デロイトは今年の XaaS に関するレポートで、ほぼ半数の組織が IT 支出の少なくとも半分を XaaS に割り当てるだろうと指摘しました。
最後に、視覚化から洞察に移行することで、運用データのダッシュボード配信における偏りの問題に対処できます。 インサイトは、単に時間内のデータ ポイントのスナップショットを表示するのではなく、データ内で発見されたパターンと関係性に基づいた情報を提供します。 さらに、洞察により、バイナリ メトリックへの依存によって発生する不要な緊急対応が排除されます。 現代のシステムは、自動的に障害が発生して回復するように構築されています。 そのようなことが起こるたびに通知されると、アラート疲れが発生し、生産性が低下する可能性があります。 ユーザー フロー全体のコンテキストでテレメトリを分析する機能は、障害が発生したコンポーネントにいつ介入が必要か、いつ必要でないかを理解できることを意味します。 複数の視覚化を解釈することに依存するモードから包括的な洞察を活用するモードに移行すると、視覚化に固有のバイアスの一部を排除できます。
ビジネスがデフォルトのデジタル モデルに近づくにつれて、必然的にデータへの依存度が高まります。 そのデータ内の偏りを排除することは、そのデータに基づく意思決定が顧客とビジネスにとって可能な限り最良の結果につながるようにするための重要なステップになります。