







数据库---泄露风险模型
是对所有可标识列进行移除或是---,使得攻击者无法直接标识用户。但是攻击者还是有可能通过多个半标识列的属性值识别个人。攻击者可能通过社工(知道某个人的姓名,邮编,生日,性别等)或是其他包含---的以开放数据库获得特定个人的半标识列属性值,并与大数据平台数据进行匹配,从而得到特定个人的---息。如果攻击者知道某用户的邮编和年龄,就可以得到该用户的------息。为了避免这种情况的发生,通常需要对半标识列进行---处理,如数据泛化等。数据泛化是将半标识列的数据替换为语义--致但更通用的数据,已上述数据为例,对邮编和年龄泛化后的数据。
数据库---平台的设计方向
包括静态大数据---平台和动态大数据---平台,所谓静态和动态之分,主要在于---的---不同。对于静态---来说,数据管理员提前对数据进行不同级别的---处理,生成不同安全级别的数据,然后授予不同用户访问不同安全级别数据的权限。对于动态---来说,管理员通过元数据管理不同用户访问具体数据的安全权限,在用户访问数据的时候,动态的从原始数据中按照用户权限动态的进行---处理。大数据平台脱敏技术方案是--个非常有趣的课题,目前业界还没有看到有成熟的方案,鉴于其对数据安全和数据价值的作用,非常值得深入研究,希望以后可以继续以合适的方式分享我在这方面的研究与实践。
静态数据库---
静态---一般用于非生产环境,在不能将敏感数据存储于非生产环境的场合中,通过---程序转换生产数据,使数据内容及数据间的关联能够满足测试、开发中的问题---需要,同时进行数据分析、数据挖掘等分折活动。而动态---通常用于生产环境,在敏感数据被低权限个体访问时才对其进行---,并能够根据策略执行相应的---方法。