なぜデータ分類が重要なのか
すべての情報片が同じ保護レベルを受けるべきというわけではありません。公開ブログ記事、社内の企画メモ、顧客契約、そして本番の機密情報は同じように扱われるべきではありません。これがデータ分類の目的です:情報を感度と事業影響でラベル付けし、人々がどのように保管、共有、保護すべきかを理解できるようにします。
単一の普遍的な命名規則は存在しません。いくつかのフレームワークは次のようなラベルを使用します:\n\t\tas Public, General, Confidential、および Highly Confidential(非常に機密)政府のモデルは完全に異なるラベルを使うことがあります。名前は変わり得ますが、目的は同じです:情報が露見、改ざん、喪失、あるいは誤った受信者に送られたときにどのような害が起こり得るかを理解することです。
4段階モデル
多くの民間セクターのチームにとって、シンプルな4段階モデルは教えやすく適用しやすいので有効です:
- Public
- Internal
- Confidential
- Restricted
このモデルが唯一の正解というわけではありませんが、感度の明確な階層を作ります。人々は数十ものラベルを暗記する必要はありません。ファイル送信、メモ共有、あるいはチャットボットに内容を見せるかどうかを判断する際に実際に使える作業モデルが必要です。
1. Public(公開)
Public 情報は組織の外部で共有しても機密性の重大な損害を引き起こさない場合があります。例としては公開ブログ記事、プレスリリース、公開されたドキュメント、承認済みのマーケティング文、公開向けの製品ページなどがよく含まれます。
Publicは重要でないという意味ではありません。完全性やレビューは依然として必要です。しかし機密性の観点では、これは最もリスクの低いクラスです。
2. Internal(社内)
Internal この情報は組織内で通常の利用を目的としています。\n\t\t漏洩した場合の被害は通常限定的ですが、それでも公開配布を意図したものではありません。社内ポリシー、会議メモ、オンボーディング資料、社内限定のスクリーンショット、通常のプロジェクト文書などがここに該当することが多いです。
ここで多くのチームがずさんになります。「あまり機密ではない」=「どこでも共有してよい」ではありません。社内データは承認されたシステムに属し、アクセス制御が必要です。
3. Confidential(機密)
Confidential この情報は誤った人に露見すると実害を招く可能性があります。顧客記録、従業員データ、非公開の財務情報、契約書、法務ファイル、社内のセキュリティ手順、非公開の価格情報、そしてプライベートなソースコードは通常このカテゴリに属します。
このレベルは通常、より強力なアクセス制限、より良い監査、そして厳格な共有ルールを必要とします。開示が顧客、従業員、法的義務、収益、あるいは信頼を損なう可能性があるなら、あなたは大抵Confidentialの領域にいるでしょう。
4. Restricted(制限)
Restricted 情報は典型的な民間企業の4段階モデルで最も高い感度カテゴリです。漏洩すると重大な事業上、法的、財務的、運用上、またはセキュリティ上の損害を引き起こす可能性があります。
例としては、本番用シークレット、root資格情報、暗号鍵、高度に機密性の高いセキュリティアーキテクチャ、合併関連資料、営業秘密、そして最も機密性の高い規制対象データセットが含まれます。これは必要性に基づく情報であり、最も厳しい管理が求められます。
分類は影響について考えること
データ分類で最も有用な習慣の一つは「これが敏感に感じるか?」と問うのをやめ、代わりに「これが露見、改ざん、あるいは誤った場所に送られたら何が起こるか?」と問うことです。
文書は見た目が地味でも依然として機密性が高いことがあります。顧客のメールを含むスプレッドシート、社内URLを含むスクリーンショット、あるいはAPIのシークレットを含むプレーンテキストファイルは劇的に見えないかもしれませんが、露見の影響は大きい可能性があります。文脈が感情よりも重要です。
もし主要なリスクがチャットインターフェースでの過剰共有であることが既にわかっているなら、このモデルを AIに絶対に共有してはいけないもの と組み合わせて、分類ラベルと具体的な例が互いに補強するようにしてください。
分類は取り扱いルールを決めるべきである
分類システムは各ラベルが行動を変える場合にのみ機能します。取り扱いルールのないラベルは飾りに過ぎません。
少なくとも、各レベルは幾つかの実用的な質問に答えるべきです:
- 誰がアクセスできるのか?
- どこに保管できるのか?
- 外部へメール送信できるか?
- AIツールにコピーしてよいか?
- 暗号化、承認、または監視を必要とするか?
単純な作業モデルは次のように表せます:Publicは外部で共有可能、Internalは会社承認のスペース内に留める、Confidentialはアクセスを限定し共有制限を強める、Restrictedは明確な承認と監視がある状態で厳格に管理する。
AIツールに関連した利点
データ分類の最大の実用的利益の一つは、チャットボットに何かを貼り付ける前、エージェントにアップロードする前、あるいはコネクタを通じて露出する前に人々に最初の判断フィルターを与えることです。
- データが Public、AIツールと共有することは通常、機密性の観点では低リスクです。
- データが Internal、それは承認された業務用AI環境でのみ許容される可能性があり、個人用や公開向けのツールでは自動的に許可されない場合があります。
- データが Confidential、通常はデフォルトで消費者向けのAIツールに入れるべきではなく、修正(redaction)や承認された企業向けのワークフローが必要になる場合があります。
- データが Restricted、最も安全な前提は、一般用途のAIツールから外すべきだということです。例外がある場合は、厳密に管理され明確に承認されたプロセスが必要です。
プライバシー制御側の判断が必要なら、次を参照してください: AI Chat Privacy Settings 。外部アクション、ツール、または統合について懸念がある場合は、セキュリティガイドの GPTs, agents, and MCP connectors が信頼境界の側面を補完します。
情報を分類する実用的な方法
分類に迷ったとき、短い影響ベースのテストで十分なことが多いです:
- それは公開を意図したものですか? はいなら、おそらくPublic(公開)です。
- 公開された場合にほとんどダメージを与えないか限られた害しか生じないか? はいの場合、\n\t\t\tInternal(社内)である可能性があります。
- 露見が顧客、従業員、法的義務、\n\t\t\t\t運用、または信頼に害を及ぼすか? はいなら、おそらくConfidential(機密)です。
- 露見が重大な損害を生じさせるか、最高レベルの保護を必要とするか? はいなら、おそらくRestricted(制限)です。
この流れは完璧ではありませんが、推測よりは遥かに優れています。主な目的は、人々が誤ったシステムに情報を共有する前に一旦立ち止まることです。
よくある誤り
頻繁な誤りは、非公開のすべての情報を同等に敏感と扱うことです。もう一つは最高ラベルを乱用して意味を失わせることです。どちらの問題も分類を弱めます。
三つ目の誤りは文脈が感度を変えることを忘れることです。見た目は無害なスクリーンショット、書き起こし、またはスプレッドシートが、名前、タイムスタンプ、内部参照、またはリンクされたメタデータを含むと識別可能になることがあります。
公式参考文献と追加の読み物
- Microsoft Learn: Data classification and sensitivity label taxonomy
- Microsoft Learn: Learn about sensitivity labels
- Microsoft Learn: Classification label concepts
- Cyera: What are the Four Levels of Data Classification?
- National Archives: Controlled Unclassified Information
- GOV.UK: Government Security Classifications Policy
- OWASP: Top 10 for LLM Applications
よくある質問
すべての企業に共通する単一の分類基準はありますか?
いいえ。組織ごとに異なるラベルや法的枠組みを使用します。重要なのはモデルが明確で一貫しており、実際の取り扱いルールに結びついていることです。
日常の職場で最も簡単なモデルは何ですか?
多くのチームでは、4段階モデルがうまく機能します:Public(公開)、Internal(社内)、Confidential(機密)、Restricted(制限)。覚えやすく、実際の判断を導くのに実用的です。
社内情報をAIツールに貼り付けてもよいですか?
場合によりますが、自動的に許可されるわけではありません。社内データは承認された業務用AI環境や、共有の制限、あるいはチャットボットや接続ツールで使用する前のマスキングが必要な場合があります。
通常どのような種類のデータがRestricted(制限)に分類されますか?
本番用のシークレット、root資格情報、暗号鍵、高度に機密性の高い法務・戦略資料、そして最も敏感な規制対象データセットは通常、最上位の保護層に属します。
なぜAIを使う前に分類が役に立つのですか?
これは最初の判断フィルターを提供するためです。もしコンテンツがConfidential(機密)またはRestricted(制限)であることがわかれば、消費者向けチャットボットに貼り付ける前に立ち止まり、より安全なワークフローを選ぶことができます。
最も一般的な分類の間違いは何ですか?
すべての非公開情報を同じように扱うこと。一部の社内資料はリスクが低い一方で、他の情報は漏洩すると深刻なプライバシー、法的、あるいはセキュリティ上の害を引き起こす可能性があります。