|
|
|
|
移动端

【RSA2018】创新沙盒 | BigID数据沙盒产品及技术解读

2018RSA大 即将召开,毫无疑问创新沙盒是大会的热点。让我们随着专家的眼睛,一起来看看RSA 2018创新沙盒TOP10的这些公司。今天是第一篇,《探秘BigID公司Sandbox产品》,分析了数据沙盒产品的特性及产品技术。

作者:绿盟科技来源:51CTO专栏|2018-04-15 16:09

【新品产上线啦】51CTO播客,随时随地,碎片化学习

2018RSA大 即将召开,毫无疑问创新沙盒是大会的热点。让我们随着专家的眼睛,一起来看看RSA 2018创新沙盒TOP10的这些公司。今天是第一篇,《探秘BigID公司Sandbox产品》,分析了数据沙盒产品的特性及产品技术。

一、BigID公司情况

1. 公司情况

BigID公司是一家位于以色列特拉维夫和美国纽约的一家初创高科技公司,成立于2016年。在2016年的融资中该公司原计划融资210万美元,结果获得了高达1610万美元的首轮融资。在2018年,考虑到公司的解决方案可以帮助企业应对GDPR法规的需求,BigID公司开展了1400万美元的A轮融资。截止2018年3月份,该公司拥有16名员工。

2. 产品情况

BigID公司从官网上看到目前就只有一款平台分析类产品。产品宣传认为其可以很好的应对GDPR,PI,PII等欧美合规要求,帮助企业更好的确保他们所拥有敏感数据的私密性,减少数据泄露,强化数据的合规保护。就满足GDPR合规性的方面,产品宣称具备以下特点:

  • 数据最小化:通过重复发现和相关性确保数据最小化
  • 许可管理:证明个人数据收集得到了用户的许可
  • 泄露提醒:遵守违反通告窗口
  • 数据主体权利:满足客户数据可携性支持以及支持遗忘数据的权利
  • 数据驻留:提供数据驻留风险的分析

3. 产品的一些分析界面

产品仪表板

图:产品仪表板

信息溯源

图:信息溯源

数据流工具

图:数据流工具

风险配置

图:风险配置

信息扫描结果

图:信息扫描结果

输出报告

图:输出报告

二、BigID产品沙盒技术分析

BigID公司的CEO Dimitri Sirota对外提到“想象我们是数据的谷歌,我们对数据进行检索归类,指出信息是属于哪个实体,数据的主体,但是它是虚拟的。我们不拷贝数据。它们仍保留在它们原有的地方”。笔者和BigID公司的Greg Pavlik进行了简单的交流,Greg Pavlik也展示和介绍了该公司产品的功能和界面,但对其技术细节没有更多的描述。此外,BigID公司官网产品资料披露信息极少,因此结合该公司高管的发言和员工的交流介绍与demo展示,笔者初步分析猜测认为该公司产品是采用了一种称为数据沙盒(Data Sandbox)的技术,这个技术在大数据分析领域也有称为分析沙盒(Analytic Sandbox)。该沙盒技术不同于以往我们传统认知在防御入侵领域的沙盒技术。在防御入侵检测领域,Sandbox多为以虚拟方式模拟一个终端或一个运行环境,检测未知代码在该虚拟环境中的运行状况,并根据运行状况来判断其是否是怀有恶意。在大数据领域,数据沙盒技术(Data Sandbox)是一种大数据分析应用手段。其原理是基于针对大数据分析的需要,不对原始数据进行拷贝和分析,仅搜索原始的结构化或非架构化的数据,形成新的数据信息仓库(data shadow warehouse)。然后根据事先定义的分析引擎去对提取的信息进行关联分析。数据沙盒技术并不算很新,多年前就已经出现,并在一些超大型跨国企业中得到了应用。

下面将对数据沙盒的特点和架构做一个简要的特点介绍和架构分析

1. 数据沙盒的特点

  • 数据沙盒会采用先进的BI(Machine Learning)和AI(Artificial Intelligence)技术帮助其对数据信息进行验证和分析
  • 数据沙盒本身可以是一个独立的分析引擎凭条,也可以运行在Hadoop之上
  • 实践中,数据沙盒多支持各种数据库以及多种数据结构,包括SQL数据库(如MSSQL,Oracle等)和NoSQL数据库(如MongoDB,Cassandra等)
  • 数据沙盒允许分析引擎从多种大数据仓库中搜索各类数据。这些数据仓库可以是本地的,也可以是云端的。数据沙盒将搜索到的数据进行信息提取并以某种固定格式进行存储,最终形成一个虚拟的数据集市(data mart )
  • 数据沙盒本身内置多种分析模型,这些模型多根据数据分析专家的需要(如商业情报或隐私保护)来进行编制。数据沙盒将根据这些分析模型对虚拟的data mart进行分析和结果呈现
  • 数据沙盒的硬件设施包括大量的并行集中处理单元,高速内存,高性能存储和I/O接口能力。

2. 数据沙盒架构展示

数据沙盒的原理架构设计

图:数据沙盒的原理架构设计

三、结束语

数据沙盒(Data Sandbox)是一种大数据分析技术。根据得到信息,笔者初步分析判断BigID公司其Sandbox的技术核心应该是采用了数据沙盒的概念和技术。通过Greg Pavlik的介绍和展示我个人认为该公司产品将数据沙盒技术与GDPR这类合规要求进行结合,创造出一种新的合规安全管控产品,从目前情况看该平台产品属于为数不多的专门针对数据合规隐私保护的平台产品。而且该平台确实能够帮助受监管的机构在一定程度上有效的管控和保护隐私数据。相信这也是RSA大会将其列为2018年度RSA大会的10大Sandbox创新厂商之一的原因。我个人觉得这类产品的出现可为国内安全厂家在产品研发上提供一种新的思路,相信通过本次RSA大会的宣传,国内国外的合规管控产品将出现一些新的气象。

【本文是51CTO专栏作者“绿盟科技博客”的原创稿件,转载请通过51CTO联系原作者获取授权】

戳这里,看该作者更多好文

【编辑推荐】

  1. Facebook数据泄露细节曝光 起因于一款个性分析测试软件
  2. Facebook数据泄露事件的谎言与真相,谁最该反思
  3. 我们该从Facebook史上最大数据泄露事件中明白什么?
  4. 2018RSA议题、创新沙盒及1万5千多份演讲稿总结 现在的事情行动起来!
  5. 2018 RSA大会热点 | 数据泄露你会是下一个吗?赶紧看两方面10点措施
【责任编辑:赵宁宁 TEL:(010)68476606】

点赞 0
分享:
大家都在看
猜你喜欢

读 书 +更多

跨越网络工程师必备训练

本书是根据全国计算机技术与软件专业资格(水平)考试“网络工程师级考试大纲”编写的考试辅导用书。全书主体按考试大纲的章节编排,分上、...

订阅51CTO邮刊

点击这里查看样刊

订阅51CTO邮刊