画·说网安丨1口气搞懂数据资产梳理
近年来,数据泄漏事件不断增多
仅2019年1月-9月
全球披露的数据泄露事件就有5183起
泄露了惊人的79.95亿条数据
全球70多亿人差不多平均每人一条
对于企业而言,数据泄漏事件一但发生
轻则丢人,企业品牌严重受损
重则丢钱,股价暴跌、天价罚单不再是梦
甚至丢命,直接关门大吉、呜呼哀哉
数据泄露的缘由多种多样
可能是黑客叮上了有缝的蛋
也可能是公司内鬼胆大包天
但究其根源
还是因为公司的数据资产管理混乱无章
要建立合适的数据资产保护措施
首要任务便是数据资产梳理
如果不知道自己的公司拥有什么数据
数据所处位置及数据敏感级别
就不可能对其保持恰当的控制
那么,数据资产梳理需要几步来完成呢?
第一步:数据分类分级
根据预定义标准
对数据资产进行一致性分类分级
例如
通过预先定义
找出能够表征数据价值的关键字
又比如
根据数据的格式
对其进行属性分类
当然
还可采用自动化技术
如机器学习、自然语言处理和文本聚类等
实施有监督学习
提取短句或组合词作为语义特征
自动生成分类规则库
从而高效地进行精准分类
第二步:数据发现
根据上步中生成的分类规则库
对所有终端、服务器、云资源进行资产扫描
弄清楚有哪些数据资产
敏感数据分布在哪里
权属关系又如何
向管理者呈现不同密级的数据分布情况
在了解这些信息后
才能更好地进行溯源和保护
第三步:持续优化
数据是动态的
每时每刻都会有新的数据产生
还会被不断地共享、修改
数据本身的敏感度也会随着时间而改变
因此
数据资产梳理必须持续进行
一旦数据资产的分布情况清晰起来
弄清楚拥有哪些敏感数据及其存储位置
就可确定是否所有数据都受到适当的措施保护
只有这样
才能保证工作优先级、控制成本
并改善数据安全管理过程
进一步有效规避数据泄露风险