警惕大数据成了互联网的“PX项目”

2018年新年伊始,BAT接连遇到了数据隐私问题带来的困扰。蚂蚁金服遭遇“支付宝个人账单隐私保护事件”,吉利控股的李书福曾发表了“微信天天盯着我们的聊天记录看”的言论让腾讯面临了一场不大不小的公关危机,江苏省消保委则是因数据隐私问题对百度提起消费民事公益诉讼,百度只能在法庭上自证清白。

BAT三个巨头不约而同在新年第一周遭遇类似的问题,着实让人感慨,中国互联网基础设施没那么好当。

大数据也成了互联网的“PX项目”——有点年纪的人可能都知道“宁波PX项目事件”,公众因为对这种石油炼化一体化项目存在认知误解,导致相关项目在国内迟迟无法推进。

BAT三家都成了冤大头

事实上,BAT三家在公众对数据隐私的敏感性面前,都成了冤大头。

1月2日,用户查看支付宝年账单,因为某些项目会涉及芝麻信用的数据,需要事先同意《芝麻服务协议》。

但同意按钮非常小,网络上讨伐支付宝的声音愈演愈烈。后来芝麻信用出来道歉称,此做法初衷没错,但用了非常傻逼的方式,愚蠢至极,并已经调整了页面,取消默认勾选。

1月4日,吉利控股李书福在正和岛新年论坛上说, “微信天天盯着我们的聊天记录看”。

后来腾讯迅速通过官方微信“微信派”作出回应:

1、微信不留存任何用户的聊天记录,聊天内容只存储在用户的手机、电脑等终端设备上;

2、微信不会将用户的任何聊天内容用于大数据分析;

3、因微信不存储、不分析用户聊天内容的技术模式,传言中所说“我们天天在看你的微信”纯属误解。

2018年1月5日,江苏省消费者权益保护委员会则是发布消息称,江苏省消保委于2017年12月11日对北京百度网讯科技有限公司涉嫌违法获取消费者个人信息及相关问题提起消费民事公益诉讼。2018年1月2日,南京市中级人民法院正式立案。

对此,百度详细地回应了这场诉讼中江苏省消保委对百度产品功能权限获取的误读,并通过亲自演示应用安装过程来进行自证清白——在安卓机上安装“手机百度”APP时每一步操作都会出现授权弹窗提醒,用户可自行决定是否接受百度获取其定位和存储等权限,百度APP没有出现越权行为。

完成“监听”要费九牛二虎之力,尤其是当前6.0以上版本的安卓操作系统对安卓手机权限的申请更加严格,手机权限申请由手机系统决定,手机APP根本没有机会进行越权操作。在手机旁边说话就能实现监听的情况,在技术上根本没办法实现。

坦率说,“被同意《芝麻服务协议》”这件事情中,蚂蚁金服有自己的小心思,某些做法确实比较鸡贼,在道德上确实诟病很多,但程序上总体是合法的。至于腾讯和百度两家,则是因为公众对技术缺乏了解,以至于造成了误会。

公众认知的几个误区

不管怎样,这一轮涉及BAT三家的数据隐私舆论危机都证明了一个问题:

公众对大数据隐私的认知非常迫切,对大数据环境下个人隐私的保护也非常重视。

但是,这种认知有时候存在误区。最简单的说,上次某媒体微博发布了极光大数据里有关王者荣耀用户画像的一则消息。

下面有一则评论和回复非常具有代表性:

评论说——我只是想问,腾讯哪里来的这么详细的数据,实名认证认证的不仅仅是年龄吗?难道知道身份证号之后就要把别人的隐私调查个底朝天,然后做成数据在洋洋得意的公布出来?

下面有个懂大数据的朋友则是回复这位网友说——这是粗颗粒的数据,早就脱敏过了。只有群像,没有单一的个体数据。评论之前最好去读一读数据相关的文章和资料。

大数据的采集、挖掘、提炼与分析本身是个技术壁垒很深,而且逻辑非常复杂的产业,大数据产业对公众认知设立了高高的技术门槛,以至于经常会产生误解。

简单来说,对大数据的认知必须把握这几个基本准则。

1、对于所有互联网公司来说,都必须遵守所在国的法律规定。滥用数据必然会遭遇法律制裁,对BAT这样的企业来说,法律永远是制约数据使用的绳索,触犯法律拿用户隐私进行商业分析,随时都会面临法律监管。

2、大数据的使用时要进行脱敏的,对某些敏感信息通过脱敏规则进行数据的变形,实现敏感隐私数据的可靠保护。没有任何一家互联网企业敢直接拿着用户数据就拿来使用。

3、大数据环境下的数据匿名技术也是大数据环境下的普遍使用的数据处理技术。个人其实在大数据面前早已经被分解成了一个个标签的颗粒,单人的整体数据不可能会被提取。

4、大数据使用早已经进入了不触及用户隐私的阶段。基于数据失真的技术通过添加噪音等方法,使敏感数据失真但同时保持某些数据或数据属性不变,仍然可以保持某些统计方面的性质。阻塞与凝聚、差分隐私保护等技术能够让用户在可以保证隐私的同时,使得大数据同时可以使用。

人们对大数据滥用的担忧的确有必要性,这对巨头来说,是一种必要的制约,但是过渡担忧的话,则是有些杞人忧天。

大企业还需普及常识

这次接二连三的事件,其实给了笔者很深的触动。

因为很多在技术领域可能算是常识的问题,在公众面前,由于对技术缺乏了解,形成了“大数据隐私恐慌”。结果很多时候公众会不分青红皂白,通过愤怒的方式去保护自己的权益。

这种心态值得理解,但是也需要企业去做引导,普及更多有关大数据隐私的常识。

可惜的是,现在很多公司忌疾畏医,看到公众的恐慌反而更畏首畏尾,在有关大数据使用这个问题上,三缄其口躲躲闪闪。

此前和某家BAT级别云计算业务负责人沟通时,提到说大数据采集、利用的问题,这家负责人摆手不谈,称容易会引发舆论危机。私下交流才发现,这位负责人认为大数据隐私的问题太过敏感,公众对技术并不了解,容易造成误解,多说无益。

但这种鸵鸟策略实际上并无太多好处,反而容易加深误解。

就像是当年盛极一时的“宁波PX项目事件”,公众因为对这种石油炼化一体化项目存在认知误解,认为对人体健康会造成恶劣影响。当地政府又躲躲闪闪不敢回应,造成了双方误解不断加深。最后PX项目在全国范围内遭到抵制,每去一个地方都会造成当地恐慌,随之而来的则是群体性事件要求PX项下马。

后来随着产业技术人员、专家不断普及PX项目的信息,公众对其环保忧虑才逐渐淡化。

大数据利用就像是互联网公司的PX项目,这次有关数据隐私的问题在开年就找上门来,也说明冰冻三尺非一日之寒。不过不管是百度这次法庭自证清白,还是腾讯对李书福公开回应都对传播大数据相关知识起到了重要作用。某种意义上来看,这对公众跟深刻了解大数据隐私保护,会起到正向作用。

大数据几乎是潮流。事实上,在未来,大企业还需要更多向公众普及常识,消除公众对大数据使用的恐慌。