Facebook丑闻反思——大数据环境下的隐形黑手

安全
互联网圈内圈外的人,几乎都在说着大数据。而对于普通用户来说,大数据是什么?大数据有什么用?大数据在很多方面都能够发挥巨大价值,但这次Facebook风波则让更多人看到了大数据可怕的一面。

作为全球用户规模最大的社交应用,Facebook月活跃用户数已经超过20亿,因此一旦Facebook出现大规模的数据问题,必定会引发轩然大波,尤其是在高度重视隐私问题的美国。5000万用户信息被第三方公司Cambridge Analytica用于大数据分析,根据用户的兴趣特点、行为动态精准投放广告和资讯内容,甚至被怀疑利用数据预测用户政治倾向,成为间接影响总统大选的隐形黑手。

[[223173]]

上一个被怀疑干扰美国总统大选的是俄罗斯,结果你也看到了,美国政府全面封杀卡巴斯基软件服务。同时,偶尔的全球黑客攻击事件矛头也往往指向俄罗斯。

而Facebook这5000万用户数据是什么概念,接近Facebook美国活跃用户总数的三分之一,美国选民人数的四分之一。更可怕的是,大数据分析之后美国民众究竟还剩下多少隐私?

[[223174]]

这份庞大数据的根源,则是由一位科学家Aleksandr Kogan开发的一个Facebook个人测试应用收集的。当Facebook用户参加测试时,他们都会允许访问自己的数据,包括姓名、地点、年龄和性别等人口统计学信息,还包括“点赞”历史,甚至一些Facebook好友的数据。

整件事情还在继续发酵,更多的内容被挖掘出来,但笔者觉得还是暂时讨论到这里吧,毕竟墙外的事情,时刻关注也不过是一名吃瓜群众。而我们真正该反思的是,我们现在的处境与美国民众所所担心出现的情形相比又相差多少呢?

大数据环境下智能推荐算法隐患

其实在这件事情爆发出来之前,笔者在知乎上看到一个内容非常值得作为Facebook这件事的参考。问题为《有没有以前很火,现在发现很危险的发明?》,几天前的一个回答发布后迅速获得了14K的赞同。答主直接点明:智能推荐算法。这个的危险性远比很多人以为的大。其中有几个例子非常有意思:

  • 某些人常浏览某圈帖子,刷几次客户端后,就容易误以为这圈子已经成了网络时代主流圈子了——事实上依旧小众;
  • 某些人总看黑某女星的帖子,刷几次客户端后,就容易误以为这女星已经人人喊打全民公敌就差贫病交加流落街头了——事实上她依旧数钱到手软;
  • 某些人讨论了几次女权相关问题,刷几次客户端后,就容易误以为天下年轻男女都不想着过日子净想着搞斗争了——事实上依旧是过日子的人多;
  • 某些人工作不顺抱怨了几个职场白领的问题,刷几次客户端后,就容易误以为当前社会最普遍的艰辛就是职场青年的苦恼——事实上跟没法被推送到你面前的人的艰辛比你那都不是事;
  • 某些人没事聊几句皇汉蛮夷,刷几次客户端后,就容易误以为这时代怎么那么多汉奸走狗,中华民族简直到了最危险的时刻了——事实上真不是;

这其实是目前国内各大个性化资讯APP、社交应用、电商所采用的所谓“智能推荐算法”或者“个性化推荐算法”,这也是基于大数据分析的结果导向之一。

[[223175]]

所谓的个性化推荐,大部分公司只道出了其好的一面,可以了解用户兴趣而推荐其想要看到的内容。但也可能潜在意思是间接帮用户选择了他们将看到的内容,而屏蔽掉了其他的内容。所以,很可能出现一个非常极端的情况就是,当你长时间用几款APP之后,每次打开你所看到的内容基本上都是一样的,这就形成了你每天所了解的全球时事,逐渐形成你所认知的世界。

结合我们实际生活,很多人喜欢看微博热搜榜,几乎每个上榜的热搜都会被数以万计的用户讨论,可能有那么一瞬间,让你觉得微博热搜榜上的事件就是今天的头条。但其实,微博能够给人展示的信息圈依然非常有限。

[[223176]]

如果再阴谋论一点的话,就如Facebook事件一样,Cambridge Analytica利用所掌握的大量用户数据,对每个用户进行高度定制的内容推送,不知不觉中逐渐影响其对某些事件的认知,甚至影响他们在总统大选中的投票。

这样一来,所谓的大数据、智能推荐算法甚至能够逐渐影响民众价值观,而这样用户根本无法察觉。

曾经有一个叫楚门的人,从小生活在桃源岛(其实是一个影视棚),看上去他的生活与常人无异,但是他不知道的是,每一秒都有上千部摄像机对着他,而他所有接触到的人包括他的妻子、朋友都是只是演员,但只有他一个人不知道。这就是20年前由Jim Carrey主演的一部电影《楚门的世界》中的情节。

[[223177]]

影片《楚门的世界》

我们谁也不想生活在楚门的世界,所遇到的事、认识的人、看到的画面都只是某种算法想让我看到的部分,而我们自己却以为是全部。当然,笔者希望这只是自己的杞人忧天。

国内社交平台可能也存在类似的信息安全隐患

放眼国内互联网现状、微博、微信、今日头条等,哪一个不是在社交或者资讯领域的“Facebook”,坐拥数以亿计的用户量,大数据应用已经深入到各大主流平台。作为全球最大的社交平台,Facebook在管理用户数据上尚且出现如此大的纰漏,利用一个小小的测试类应用就能够获取大量用户真实信息。而在国内的各大社交平台,依然充斥着各类情感测试、性格测试、投票等小应用,这一类应用究竟能够获取多少信息,我们似乎并不清楚。

[[223178]]

除此之外,还有越来越多的网站、APP纷纷接入微信、QQ、微博登录,第三方应用也可以获取社交账号的用户名、头像等信息。突然想起来一句话“当你接入互联网的那一刻,也许你的隐私就失控了”,让我们感受到害怕的不仅仅是凶兽恶徒,那些我们无法看见、无法控制的一些东西同样能够让我们不安。

关注的Facebook事件的同时,我们更担心Facebook事件在国内悄悄上演。

责任编辑:赵宁宁 来源: FreeBuf
相关推荐

2018-03-28 17:16:09

大数据

2017-09-22 14:38:23

2012-10-23 09:48:37

2016-10-13 09:52:53

大数据搜索技术

2018-03-24 17:13:54

2014-04-22 13:17:23

综合布线布线技术

2015-04-08 10:58:13

综合布线大数据

2012-09-29 09:37:42

Facebook大数据Hadoop

2012-08-23 14:21:47

大数据

2012-08-23 15:10:44

Facebook

2014-08-01 10:20:05

2018-08-24 13:34:50

2011-07-27 16:11:11

HadoopMapReduceMPP

2012-02-07 09:41:46

XFSext4文件系统

2013-06-20 09:43:31

2018-03-29 09:22:06

Facebook数据app

2013-12-12 10:00:03

大数据

2013-05-30 09:53:04

阿里金融阿里巴巴大数据

2013-11-04 09:43:34

FacebookHadoop大数据

2016-10-10 14:05:46

存储
点赞
收藏

51CTO技术栈公众号