[转]当你同意App获取数据时,你知道后果吗?

原文链接:http://www.infzm.com/content/143980

以下原文:


2018年8月,中国消费者协会发布的App调查报告介绍,约86.5%的受访者曾收到推销电话或短信的骚扰,约75%的受访者曾接到诈骗电话,约63.4%的受访者曾收到垃圾邮件,这表明App个人信息泄露情况非常严重。(CFP/图)

(本文首发于2019年1月17日《南方周末》)

人们通常不会去认真阅读数据收集和使用的相关解释条款,但研究表明,很多App会将个人数据在短时间内传输到数百个不同的网络域名上。即便用户同意App分享自己的个人信息,人们对如此规模的信息流动及其后果的认识也是不充分的。

当新下载的App说要获取你的手机权限和位置时,你同意了吗?当你填写信息点击注册的时候,你知道用户隐私协议里写的都有什么吗?当你完善了各类资料之后,你清楚自己的信息将通过什么方式在什么时间被用到什么地方吗?

2018年12月《社会科学计算机评论》(Social Science Computer Review)发表的一项基于德国人的研究,描述了这样的尴尬现状:人们通常不会去认真阅读数据收集和使用的相关解释条款,并且愿意被跟踪分享大量关于自己的数据,对于各类不同的数据索取请求基本不会加以区分。而且,一旦同意App获取自己的数据,就不会撤回。

这个撤回的操作略显特别,是2018年5月正式在欧盟全部成员国施行的《通用数据保护条例》(General Data Protection Regulation)中的规定,该法条认为数据主体有权随时撤回自己的同意,并且撤回应和同意一样容易。

不过诸如德国这样的科学研究所揭示的,权利在运行中同样面临着复杂而尴尬的挑战。而另一方面,正如人们所看到的,由于个人数据保护工作的不到位,Facebook上的个人数据被用于操纵美国民意,干扰总统选举,一些中国消费者的手机型号和消费习惯被用于“杀熟”,同样的商品在不同人的手机上被显示出不同的价格,再加上铺天盖地的骚扰电话,甚至一些基于关键信息泄露而展开的针对性很强的电信诈骗,个人数据隐私问题对今天很多正经历着数字生活的人们来说,正显示出特别的意义。

知情同意是否形同虚设

个人数据保护的特别之处就包括,数据的生产、使用和保护是紧密结合的,获取一些服务要以让渡部分数据共享权利为前提,而且数据可轻松复制、传播的特点,让数据被作为资源时,对于个人和信息服务商有不同的意义。对绝大多数个人来说,自己的数据首先是隐私问题,而对收集了大量数据的公司来说,数据就是财富。

不过,最近这项基于德国的研究还没有被放置在这么复杂的商业背景下,来自德国曼海姆大学(University of Mannheim)等单位主要研究调查和统计方法的弗洛克·克罗伊特尔(Frauke Kreuter)等人,并不是要专门研究App个人数据隐私保护问题,而是探讨智能手机作为社会调查工具收集数据的可行性,而这一研究正是被放置在欧盟《通用数据保护条例》对数据收集提出更高要求的背景下。

在向4293人发出邀请,告知要进行六个月的数据收集后,652人同意参与,研究者通过跟踪这652名拥有安卓手机、同意下载安装实验规定App的人们的网络行为,展开研究。结果发现,几乎所有人都很快地点击了同意收集自己的信息,对于研究提出要收集的“移动手机网络质量和位置信息”“互动记录”“社交网络特征”“活动数据”等不同类型的信息,绝大多数人都同意了。而且不同类型数据的同意比例非常相似,85%的人同意了之后就没有再撤销过,只有18%的人在点同意之前看了所有数据收集的描述,至少看过一项数据收集情况说明的也只有30%。其中,对年龄的分析显示,年轻人比老年人看说明的比例要高,15-20岁的人和60岁及以上的分别占到了48%和16%。

研究者据此认为,在《通用数据保护条例》和研究伦理都这么重视参与者知情同意态度的情况下,用手机收集调查数据,原本以为会减轻被调查者负担,没想到,“知情同意”对于参与者来说,其实带来了额外的负担。

跳出实验,类似的矛盾在日常状态下,其实非常普遍。早在2014年10月,《计算机法律和安全评论》(Computer Law & Security Review)上,一项有100个中国大学生参与的小样本调查结果显示,尽管96%的人表示自己用手机时很在意自己的隐私,但100%的人没有读过隐私政策,大部分人都认为看不看意义不大,因为必须同意,不同意就用不了。

而另一方面,App在获取个人信息之后,在后台可能很快会开始其快速的流动,挪威奥斯陆大学(University of Oslo)研究社交媒体使用的学者彼得·布兰德扎格(Petter Bae Brandtzaeg)称之为对数据感到饥饿的App,他在2018年5月发表于《社会科学计算机评论》上的一篇文章中指出,在对挪威比较流行的21种免费安卓移动App的数据流进行了48小时的分析后发现,其中19个App总共将个人数据传输到了大约600个不同的网络域名上,他觉得对数据感到饥饿的App已经失控了。显然,即便用户同意App分享自己的个人信息,但私下里这样规模的信息流动,人们对其认识是不充分的。

这样一来,似乎既未真的“同意”,也并不“知情”,那原本是为了保护用户隐私的“知情同意”设置,有什么意义呢?

用户信任VS公司利润

这种很高的同意比例很容易从表面上被解读为,大家对App的信任度非常高,但彼得·布兰德扎格在样本量为960个人的研究中发现,事实并非如此。在回答“当App说要获取你的联系人列表和位置等信息,而你不想提供时,你是否克制过自己不去下载或使用”这个问题时,大约75%的人说自己曾忍住了,超过一半的人说自己多次这样克制住了。40%的人表示对App掌握自己的个人信息很不信任,90%的人对App超出其功能之外地使用自己的个人信息表示不满。

而对于欧洲来说,一个现实问题就是,很多流行的App来自美国,彼得·布兰德扎格在对21款App的数据流研究时发现,被传到的近600个不同的域名大部分都是美国的科技公司,他告诉南方周末记者,“那些大的互联网公司在监控用户方面,有很少的内部、外部管理,这是它们去构筑出色服务的基础,但另一方面,它们所开发和销售的技术也可能对个人带来风险,把利润置于道德和隐私之上是不好的。”

不同的法律环境正考验着跨国公司在数据保护问题上的能力,尤其是欧盟推出新的数据保护条例之后,类似的冲突正在增多。“我相信到目前为止,大部分科技公司还没能遵守《通用数据保护条例》。”彼得·布兰德扎格向南方周末记者解释,许多公司仍在努力适应,但很困难,因为许多公司缺乏隐私相关的能力,而且对条例有不同的理解。

而对于中国,夹在用户信任和公司利润之间的个人数据隐私安全问题同样不容忽视。早在2015年12月,北京社会科学院经济所副研究员王忠曾在一项基于17种个人数据收集场景,样本主要是本科以上学历人群的调查中,发现中国人在网购、社交等信息服务中,其实有严重的隐私信任危机,比如尽可能提供虚假信息,以及买两个手机号的行为等。

但一方面,王忠又觉得,今天中国个人数据隐私保护问题,症结还在于社会对隐私保护的观念认同度不够,他向南方周末记者解释,“中国20年前还有70%的人生活在农村,直到9年前城市人口才达到一半,绝大部分中国人都还带有熟人社会留下的观念和习惯,世代相邻而居,东家长西家短都是日常谈资,君子坦荡荡的观念也深入人心,除了传统文化中羞谈之事,不少人对于隐私持无所谓态度。”

到社科院之前,王忠曾在工业和信息化部电子科学技术情报研究所,从事信息服务产业政策及规划相关的工作。在他看来,近几年中国各类隐私保护规章制度在不断完善,但社会认同度不高的话,法律很难有效实施,“最为关键的是隐私教育,熟人社会人际交往是一种重复博弈,一次投机行为将付出很严重的代价,通过口口相传可能整个社交网络都会将其拒之门外,现代社会交往的都是陌生人,投机行为的可能性会增加,尤其整个社会的信用体系尚未完全建立起来,难以判断获取信息之后会用于什么用途,面对各种数据收集者,人们应该对自己的隐私风险有一定认识,避免经济或者精神损失。”

那么,App获取个人信息后,真的没法判断将用于什么用途吗?如果用户无法判断自己的信息将被用在什么地方,信任又该何处安放呢?

个人数据去向应该可视化

2018年12月,《计算机协会交互式、移动、可穿戴和普适技术汇刊》(Proc. ACM Interact. Mob. Wearable Ubiquitous Technol)发表的一项App数据流动用途研究中,来自卡内基梅隆大学(Carnegie Mellon University)等单位的学者,提出一个“手机域名意图”(MobiPurpose)的技术,通过拦截智能手机发出的信息需求,然后基于文本模型对数据类型自动分类,结合App信息流通内外特征,通过机器学习去预测数据收集目的。

在50天的实验中,拦截了来自1万多个App的两百多万个信息请求,发现长尾分布很明显,77.3%的域名只与1个App有关联。这与彼得·布兰德扎格在21个流行App数据流研究中的情况类似,来自个别App的海量信息被分发到大量站点,为它们的运营提供数据支撑。

但这些在App用户界面背后发生的事情,绝大部分非专业人士并不知道,彼得·布兰德扎格建议使用特定的可视化方式来增强App中个人数据流的透明度,“心理学上讲眼见为实,所谓一张图片胜过千言万语。”彼得·布兰德扎格向南方周末记者解释,复杂场景可以只用一张图表示,并且在传达意思或本质时更有效率。类似的观点其实并不少见,近年来许多研究都提出可以让App中个人数据的处理更加透明化,只是,现实中,似乎还未有明显变化。

其结果就是,人们很大概率不会去看用户隐私协议,即便有人点开看了,也可能会因为其冗长的篇幅和艰涩难懂的术语而停住。由此,个人数据是否被滥用,怎么被滥用,成了一个谜。而且未发生侵权案件的时候,似乎并没有人去在乎,即便有人发现信息泄露了,也很难找到泄露的源头和路径。

那么,谁应该对此负责呢?早在2017年开始施行的《中华人民共和国网络安全法》中,对网络运营商收集、使用信息制定了多条规定,比如应公开收集的目的、方式、范围,获得被收集者同意,不得收集与服务无关的信息,未经被收集者同意,不得向他人提供个人信息等等,特别是第四十三条,提出个人发现网络运营商违反法律和双方约定去使用个人信息的,有权要求其删除。但实际情况往往是,个人对此一无所知,更难以判定运营商是否违法。

一个相对客观公正又有效率的第三方监督机制的存在就显得非常重要,这套监督机制应建立在个人数据流向清晰明了的基础上。为此,运营商应在用户使用前就用简易图示等方式,清晰地展示自己将如何收集、使用信息,确保有基本认知能力的人能够理解。正如“手机域名意图”项目将继续探究的事情一样,相关约定的和实际的个人数据流向,作为重要的公共信息,应该在公共平台上随时能查询到。在此基础上,个人和职能部门才能更容易地做出隐私决策,开展相关的行动。

个人数据权利应得到尊重

对个人数据隐私加强管理并非否认数据收集的社会价值,也并非要剥夺App收集数据的权利。事实上,作为人工智能和数据经济的基础,数据对未来人们的生活和经济发展将产生极大的影响,但这一切应建立在“信任”和“道德”的前提下。如果数据收集不讲基本的规则,总是背地里侵犯用户的数据权利,那么真相一旦公开,不仅面临法律的制裁,而且终将被用户抛弃,甚至影响整个数据产业的良性发展。

而不信任感一旦建立,社会沟通成本将急剧上升。欧盟对这种用户信任感和市场的关系有特别的关注。以健康数据为例,早在2014年,欧盟就开始尝试推出移动健康App的行为准则,目的是促进用户对移动健康App的信任,以使得遵守规则的App将来在市场竞争中获得优势。而《通用数据保护条例》更是给违法行为开出了最高可达2000万欧元(约1.5亿人民币)或企业上一财年全球营业总额的4%的罚款,并以较高者为准。

“欧盟隐私保护传统更深厚,希特勒能精准地逮捕犹太人,就得益于政府强大的数据收集能力。同时期的中国,连基本的人口普查都做不到。”王忠觉得欧盟与中国情况有很多不同,除了隐私保护传统外,欧盟市场上的大型互联网企业基本都是来自美国的外企,法律制定和执行的阻力相对较小,相比而言,在中国,严厉的处罚措施不容易出台。

需要指出的是,目前关于App数据流向的研究主要都针对的是欧美地区,对中国境内App上个人数据真实用途的实证研究相对较少。但2018年8月,中国消费者协会发布的《App个人信息泄露情况调查报告》中,样本量为5458份的网络问卷调查结果显示,约86.5%的受访者曾收到推销电话或短信的骚扰,约75%的受访者曾接到诈骗电话,约63.4%的受访者曾收到垃圾邮件,显示App个人信息泄露情况非常严重。

早在2015年,美国伍斯特理工学院(Worcester Polytechnic Institute)的苏珊·兰道(Susan Landau)在《科学》杂志的文章中分析,想要控制数据的用途是很复杂的,要防止来自商业、政府对个人数据权利的侵犯,最好的方式是能将技术、政策、法律结合起来。而另一方面,2018年12月,包括《美国医学会杂志》(JAMA)在内的学术期刊已经在探讨如何利用社交网络数据去揭示人类健康的社会决定因素,但第一步就是建立法律和道德框架,以应对数据隐私和安全问题,就像人类基因组计划那样。

今天,包括智能手表、手环等在内的可穿戴的数据收集设备,已经超越了单纯社会层面的意义,将个人数据收集类型延展到了生命体本身。这些数据可以透视个体存在的最基本的信息,如果被滥用,其后果可能不是“徐玉玉案”那样因高考招生信息平台数据泄露所能比的。

同意App获取自己数据时,你是认真的吗?这个问题确实需要全社会一起来好好回答。