定義済み EDD ルールによって検出されるコンテンツ
このトピックでは、 Endpoint Data Discovery Secure Endpoint Agent の軽量ソフトウェアコンポーネントで、EDD スキャン中に Windows または Mac デバイス上に保存された、リスクのあるデータを検出します。DAR コンポーネントは、「Endpoint Data Discovery ポリシー」がアクティブになっているポリシーグループにデバイスが関連付けられている場合のみ、そのデバイスに展開されます。 ポリシーが有効な場合に、デバイスにインストールされている Secure Endpoint Agent の DAR コンポーネント Endpoint Data Discovery ポリシーは、管理中の Windows および Mac デバイスのハードドライブをスキャンして、個人の健康情報、クレジットカード情報、SSN などのファイルの機密情報を調べます。スキャン結果は EDD レポートで報告され、リスクのあるデバイスの特定に役立ちます。 によって検出されるデータについて、具体的に説明します。また、ファイルコンテンツが事前定義の各 EDD ルールにどのようにマッチングされ、マッチスコアが生成されるかについても説明します。
お客様の組織にとって特に関係が深いファイルコンテンツを検索するために、カスタム EDD ルールをいくつか作成することができます。
式および式セットに関して
DAR コンポーネントは、SSN や識別子などのコンテンツのタイプを特定するために式を使用します。EDD ルールでは、式は値、変数、演算子、関数の組み合わせで構成され、特定のファイルコンテンツを検出するために EDD スキャンの間に実行されます。特定のコンテンツタイプを検出するために作成された式を組み合わせたものが、式セットです。ファイル内のコンテンツが式に一致すると、そのファイルにマッチスコアが割り当てられます。
辞典に関して
DAR コンポーネントは、辞典式セットを使用して医療用語や金融用語など、一部の種類のコンテンツを特定します。辞典は単純な式を使用して単語やフレーズのリストを作成し、デバイスのスキャン時にそれをファイルのコンテンツと比較します。ファイル内のコンテンツが辞典の式に一致すると、そのファイルにマッチスコアが割り当てられます。
定義済み EDD ルール
デフォルトでは、Absolute アカウントには定義済みの EDD ルールのセットが含まれます。ポリシーエリアで EDD ポリシーを設定するときに、1 つ以上の定義済みルールを EDD スキャンに適用できます。定義済みルールは必ずデータ暗号化を使用し、リダクションを使用する場合もあります。次の定義済みルールが利用可能です:

DAR コンポーネントは、Visa、MasterCard、Discover、American Express、Diner's Club などのクレジットカード番号のブランド固有のパターンを特定するために式を使用します。各クレジットカードに固有の番号パターンがあり、特定の接頭辞や桁数などが決まっています。
クレジットカード番号は、スペース区切りのセグメント (トークン) に分割され、各セグメントが 3 桁以上である場合に認識されます。ハイフン (-) などの特殊文字も認識されます。また、 Luhn アルゴリズム モジュラス 10 または mod 10 アルゴリズムとも呼ばれます。クレジットカード番号などの識別番号を検証するために使用される単純なチェックサム方式。 を使用して、文字列が有効なクレジットカード番号であり、ランダムな数字の羅列でないことを確認します。
有効な固有のクレジットカード番号がファイルで検出されるたびに、マッチスコア 1 が生成されます。たとえば、同じクレジットカード番号が 1 つのファイルで 3 回検出された場合、マッチスコア 1 が生成されます。一意のクレジットカード番号が 3 つ検出された場合、マッチスコア 3 が生成されます。

DAR コンポーネントは、 暗号化ファイル 暗号化形式に変換され、不正なユーザーがファイル内にある機密データを閲覧できないようにしたファイル。ファイルの復号と表示には暗号化キーが必要です。とパスワードで保護されたファイルを識別します。コンポーネントはこれらのファイルを開いたり分析したりできないため、これらには暗号化コンテンツタイプを割り当てます。暗号化ファイルまたはパスワードで保護されたファイルごとに、マッチスコア 1 が生成されます。

DAR コンポーネントは、 欧州経済領域 (EEA) 一般データ保護規則 (GDPR) は、欧州経済領域 (EEA) に住む個人に関連するデータを処理するすべての組織に適用される、一連のデータ保護規則を定めます。 の加盟国向けに 一般データ保護規則 (GDPR) EEA の加盟国は、欧州連合 (EU) 加盟国にアイスランド、リヒテンシュタイン、ノルウェーを加えた国々です。欧州の単一市場に参加する国々を定義します。 で定められている保護要件の対象となる個人識別データを特定するために式を使用します。
事前定義済みの GDPR 個人データルールでは、以下の 40 種類の個人データが検出されます。
- 納税者番号 (オーストリア)
- 国民登録番号 (ベルギー)
- 統一市民番号 (ブルガリア)
- マスター国民番号 (クロアチア)
- 個人 ID (クロアチア)
- 納税者番号 (キプロス)
- 生年月日番号 (チェコ共和国およびスロバキア)
- 市民登録システム (デンマーク)
- 個人 ID 番号 (エストニア)
- 個人 ID 番号 (フィンランド)
- 社会保障番号 (フランス)
- 社会保障番号 (ドイツ)
- 納税者番号 (ドイツ)
- 個人 ID 番号 (ギリシャ)
- 社会保障番号 (ギリシャ)
- 納税者番号 (ギリシャ)
- 個人 ID (ハンガリー)
- 個人番号 (ハンガリー)
- 社会保険番号 (ハンガリー)
- 個人 ID (アイスランド)
- パブリックサービス番号 (アイルランド)
- 税金コード ID (イタリア)
- 個人コード (ラトビア)
- 個人 ID 番号 (リヒテンシュタイン)
- 個人コード (リトアニア)
- 個人 ID (ルクセンブルグ)
- 身分証明書番号 (マルタ)
- 市民サービス番号 (オランダ)
- 個人 ID 番号 (ノルウェー)
- 個人番号 (ポーランド)
- 市民 ID 番号 (ポルトガル)
- 社会保障番号 (ポルトガル)
- 納税者番号 (ポルトガル)
- 個人番号コード (ルーマニア)
- マスター国民番号 (スロベニア)
- 国民 ID 番号 (スロバキア)
- DNI 番号 (スペイン)
- 個人 ID 番号 (スウェーデン)
- 国民保険サービス (英国)
- 国民保険番号 (英国)
ルールには、以下のような有効な EEA 個人情報を定義する式が含まれます。
- Codice Fiscal (または CF) の後に有効なイタリアの税金コード ID 番号を付けたもの
- Documento Nacional de Identidad (または DNI) の後に有効なスペインの DNI 番号を付けたもの
ファイルの GDPR 個人データマッチスコアは、一意の EEA 個人情報の合計数を数えることで計算されます。

DAR コンポーネントは、特定のファイル拡張子をスキャンして、デバイスにインストールされた人工知能 (AI) アプリケーションを識別します。AI アプリの使用中に、ユーザーが不注意で専有情報や機密情報を共有する可能性があるため、AI アプリにはリスクがあります。
ローカル AI モデルルールは、以下のファイル拡張子を検出します。
ファイルの拡張子 | 組織/モデル名 |
---|---|
.cafemodel | Caffe |
.ckpt | TensorFlow Checkpoint |
.coreml | Apple Core ML |
.dlc | Qualcomm Deep Learning Container |
.ggjt | llama.cpp/GGJT |
.ggmf |
llama.cpp/GGMF |
.ggml | llama.cpp/GGML |
.gguf | llama.cpp/GGUF |
.keras | Keras |
.llammafile | LLama |
.mleap | Spark MLeap |
.onnx | ONNX |
.pb | TensorFlow Saved Models |
.prompt | HumanLoop |
.pt2 | PyTorch Torch.export |
.pte | PyTorch ExecuTorch |
.ptl | PyTorch mobile |
.safetensors | Safetensors |
.surml | SurrealDB SurrealML |
.tflite | TensorFlow TFLite |
.tfrecords | TensorFlow TFRecords |
新しいアプリケーションが確実に検出されるよう、このファイル拡張子のリストは毎月見直しと更新が行われます。
アプリケーションの検出が発生するたびに、マッチスコア 1 が生成されます。

DAR コンポーネントは、以下の式セットを使用して米国の個人金融情報 (PFI) のコンテンツを特定します。
- 金融用語
- 個人の金融識別子
金融用語とは、以下のような単語やフレーズを含む辞典です。
- 口座残高
- 年率
- 口座振込
- 住宅ローン
- 銀行支店コード
個人の金融識別子は、以下に挙げるような有効な識別子を定義する式を含みます。
- 社会保障番号または SSN (その後に有効な社会保障番号が続く) 。
- アカウント、ローン、お客様、証明書など (その後に名前や番号が続く)
コンポーネントがマッチを検出し、それを EDD レポートで報告するには、両方の式セットがマッチする必要があります。例:
検出済みのファイルコンテンツ | マッチが検出されたか? |
---|---|
SSN 332-65-4872 および口座残高 がファイルで見つかった。 |
はい マッチスコア = 1 |
口座残高および口座振込というフレーズがファイルで見つかった。個人の金融識別子は検出されていません。 |
いいえ マッチスコア = 0 |
ファイルの PFI マッチスコアは、一意の個人の金融識別子の合計数を数えることで計算されます。マッチを検出するには、ファイルに少なくとも 1 つの金融用語が含まれる必要がありますが、マッチした金融用語にはマッチスコアは割り当てられません。そのため、マッチスコアが高いほど、ファイルに 1 人だけでなく多数の人の個人の金融情報が含まれる可能性が高まります。

DAR コンポーネントは、以下の式セットを使用して米国の個人健康情報 (PHI) のコンテンツを特定します。
- 医療用語
- 個人健康 ID (社会保障番号とメディケア受益者 ID を含む)
医療用語とは、以下のような単語やフレーズを含む辞典です。
- 骨折
- CT 検査
- けいれん
- 侵襲性線維腫症
- 目屈折
個人の医療識別子は、以下に挙げるような有効な識別子を定義する式を含みます。
- 社会保障番号 (その後に有効な社会保障番号が続く) 。
- 生年月日 (その後にサポートされる形式の日付が続く)
- 患者 (その後に名前や番号が続く)
- アカウント、メンバー、記録など (その後に番号が続く)
コンポーネントがマッチを検出し、それを EDD レポートで報告するには、両方の辞典がマッチする必要があります。例:
検出済みのファイルコンテンツ | マッチが検出されたか? |
---|---|
DOB:10/02/1974 および骨折という単語がファイルで見つかった。 |
はい マッチスコア = 1 |
生年月日:12/06/1953 および患者 325487 がファイルで見つかった。医療用語は検出されていません。 |
いいえ マッチスコア = 0 |
ファイルの PHI マッチスコアは、一意の個人の医療識別子の合計数を数えることで計算されます。マッチを検出するには、ファイルに少なくとも 1 つの医療用語が含まれる必要がありますが、マッチした医療用語にはマッチスコアは割り当てられません。そのため、マッチスコアが高いほど、ファイルに 1 人だけでなく多数の人の個人の医療情報が含まれる可能性が高まります。

DAR コンポーネントは、nnn-nn-nnnn 形式で書かれた有効な米国社会保障番号 (SSN) を特定するために式を使用します。
以下のパターンは無効な SSN を示します。
- いずれかのグループですべてゼロの番号がある (000-nn-nnnn、nnn-00-nnnn、nnn-nn-0000)。
- 666 または 9nn で始まる番号。
SSN のナンバリングについては、USrecordsearch.comを参照してください。
有効な固有の SSN がファイルで検出されるたびに、マッチスコア 1 が生成されます。たとえば、同じ SSN が 1 つのファイルで 3 回検出された場合、マッチスコア 1 が生成されます。一意の SSN が 3 つ検出された場合、マッチスコア 3 が生成されます。

DAR コンポーネントは、EDD スキャンの時点でシステムリソースが不足していたためにスキャンできなかったファイルを識別します。スキャン不可のファイルにはそれぞれマッチスコア 0 が割り当てられます。