百度粉丝网

初创公司应用深度学习来保护非结构化数据

产品路线图,合同和公司战略的其他组成部分形式的数百万个文档也代表了内部或云中存储的无结构的脆弱数据,事实证明如此。

 

一家名为Concentric的数据安全初创公司本周从隐身模式中脱颖而出,声称是第一个使用深度学习工具来帮助公司确定非结构化数据驻留在何处以及如何保护它的公司。在量化数据安全挑战的同时,Concentric还声称其“语义智能”平台可生成洞察力,这些洞察力可用于保护战略数据,同时还可满足数据治理要求。

由业内资深人士创立的这家位于圣何塞的创业公司也在周三(1月29日)宣布了由Clear Ventures牵头的750万美元融资。

Clear Venture的创始人兼管理合伙人克里斯·鲁斯特(Chris Rust)说:“非结构化数据现在是该行业的主要威胁面,因为它高度分散并且以各种形式出现,并且很难保护关键业务内容。”

同心的自动化方法应用深度学习来生成对非结构化数据的语义理解。根据这家初创公司的说法,其框架可以发现,分类和分类业务文档。该初创公司发布的另一份数据风险报告指出,企业数据中心通常包含数百万个不安全的文档,这些文档可能在组织之间不适当地共享。

除了通过“过度共享”防止数据泄露外,该方法还可以保护用户免受与越来越多的数据隐私法规有关的罚款。

安全挑战带来了从薪资信息到源代码的各种非结构化公司数据,而且这种情况正在增长。同心估计,一家普通公司平均可产生约1000万份文档,其中约120万份文档被视为“关键业务”。

根据数据安全性研究,超过80%的企业数据是非结构化的,这意味着它们被嵌入到组织中分布的文档和源代码文件中。随着员工“共享”安全分类不足的数据,这些数据变得更加脆弱。

Concentric首席执行官兼联合创始人Karthik Krishnan表示:“大量数据没有安全保障,无法识别,分类错误并处于风险之中。” “目前,非结构化数据非常丰富且分散,其中包括数量惊人的关键业务信息。”

该初创公司指出,当前用于保护数据库或限制访问的安全框架并不涵盖非结构化数据。考虑到非结构化数据安全性问题的范围,其语义平台寻求使一项任务自动化,而这将使已经应对持续不断的错误警报的IT团队不堪重负。

Concentric没有提供有关其语义智能平台的技术细节,但声称已经扫描了来自金融和医疗保健行业客户的2600万个非结构化数据文件。它的深度学习方法通​​常侧重于过度共享业务文档。该框架采用了一个公式,该公式权衡了由于安全违规和不适当的文档共享而造成的物质损失。

数据安全研究发现,过度共享非结构化公司数据非常重要,因为它“大大增加了威胁面”。

这家初创公司的创始人曾在网络和安全公司工作,包括Aruba Networks,Hewlett Packard Enterprise,Juniper Networks,PGP Corp.及其母公司Symantec。

旨在帮助实现数据安全自动化的机器学习方法在公共和私营部门中都越来越受欢迎。例如,国防高级研究计划局去年宣布了一项努力,以填补企业网络中的安全漏洞。该机构说,例如,在DARPA计划下开发的威胁检测算法可用于对威胁“在不同数据类型和来源的情况下”。