2023 年に登場したテクノロジーの中には、あらゆる技術者の注目リストに載せるに値するものが数多くあります。 その中にはデータマスキングがあります。 実装においてはデータ漏洩防止と類似していますが、データ マスキングとデータ漏洩防止にはまったく異なる使用例があります。
後者は、長年にわたり、あらゆる主要な Web アプリおよび API セキュリティ ソリューションの機能となってきました。 しかし、生成 AIなどのテクノロジーの台頭により、データ マスキングの必要性が認識され始めたばかりです。
データ マスキングは、元のデータを、同様の構造と形式を維持する架空のデータまたはスクランブルされたデータに置き換えたり難読化したりすることで、機密情報を保護するために使用される手法です。 この方法は、データを共有したり、テスト、トレーニング、分析の目的で使用したりする必要があるが、実際の機密情報は機密のままにしておく必要がある状況でよく使用されます。 データ マスキングは、組織がデータ プライバシー規制に準拠し、データ侵害のリスクを軽減し、データセット内に情報が含まれる個人のプライバシーを保護するのに役立ちます。
データ漏洩防止 (DLP) は、機密情報を不正アクセス、漏洩、または悪用から保護するために設計された一連の戦略、ポリシー、およびツールです。 DLP の主な目的は、個人情報、知的財産、企業秘密などの機密データが組織のネットワークまたはシステムの外部に偶発的または意図的に漏洩するのを防ぐことです。
市場は、青リンゴは赤リンゴとは違うと主張し、衒学的考えを受け入れているように見えるかもしれません。 結局のところ、データ マスキングと DLP はどちらも、アプリケーションや API で使用される機密データ フィールドを「マスク」または「難読化」するために同じテクノロジに依存する傾向があります。
その違いは2つあります。
まず、データ マスキングの主なユーザーは、開発者、データ サイエンティスト、MLOps です。 実際の顧客データを使用してテストやトレーニングを行ったり、分析したりする必要がある従業員またはパートナーです。 これにより、匿名のままでいることを希望し、企業のプライバシー ポリシーによって匿名のままであることが保証されている可能性のある顧客が危険にさらされることになります。 DLP ユーザーは最終的にはビジネスです。 口座番号やクレジットカード番号などの機密情報をマスキングすることを要求する規制を遵守することは企業の責任であり、データが漏洩するとビジネスに損害が生じます。 組織が DLP を採用するのは消費者を保護するためだと主張することもできますが (実際そうなっています)、主な推進力は通常、規制です。
2 番目に、DLP は個人情報の特定のサブセットのみを識別してマスクします。 請求書を受け取ると、口座番号は隠されていますが、名前と住所は隠されていません。 データ マスキングでは、顧客の匿名性を保つために、名前、住所、その他の識別情報が難読化されることがよくあります。 これは、ユースケースが分析をターゲットとしている場合に特に当てはまります。分析では、マーケティングや予測の目的で顧客全体のパターンと関係性が求められますが、特定の顧客を識別しない理由があります。
2024 年のテクノロジーの「ウォッチ リスト」を作成する場合、データ マスキングは間違いなくトップ 10 に入るに値します。
これは、多くの取り組みに幅広く適用できるためですが、特に、顧客行動に関する洞察を収集したり、ビジネス戦略に役立つパターンを発見したりするために ML モデルの分析とトレーニングに取り組んでいる取り組みに特に当てはまります。
生成型 AI と従来型 AI が地球上のあらゆる製品やサービスに浸透し始めるにつれて、消費者はプライバシーの必要性をますます認識するようになりました。 機密データをマスクできれば、企業は AI イニシアチブを推進するとともに、顧客のプライバシーのニーズを満たすことができます。