自動的に検知:三菱電機が機密文書を発見する新技術、情報漏えい対策に期待 - ITmedia エンタープライズ(情報元のブックマーク数)

三菱電機がメールに含まれる機密データを自動的に検出する技術を開発したそうです。

それも、自動学習してくれるそうで、サンプルから自動学習だそうです。

三菱電機は3月25日、ドキュメントファイルや電子メールに含まれる機密文書データを自動的に検出する技術を開発したと発表した。情報漏えい対策などに利用でき、4月以降の商品化を計画する。
開発した技術は、管理者などが機密文書として指定するキーワードでの検出と自己学習型フィルターと呼ばれるテキストデータの抽出・分析技術を組み合わせたもの。自己学習型フィルターは、事前にサンプルとなる機密文書データを登録しておくことで、機密文書に含まれる特徴を記憶し、検出対象データと記憶したデータと照合することで、機密文書を抽出する。

三菱電機が機密文書を発見する新技術、情報漏えい対策に期待 - ITmedia エンタープライズ

ベイズ技術を使ってる感じですね。

新技術と正規表現を参照する従来型のフィルタ技術による検出精度を、約1万4000件のサンプルファイルで比較したところ、機密ファイルを正しく「機密」として検出した割合は新技術で99.9%、従来技術で89.7%だった。また、機密ではないファイルを機密として誤って検出した割合は、新技術で1.3%、従来技術が3.6%だった。この実験では、自己学習型フィルターに1万3000件の機密文書をサンプルとして登録した。

三菱電機が機密文書を発見する新技術、情報漏えい対策に期待 - ITmedia エンタープライズ

screenshot