You've successfully subscribed to 完美的胖达
Great! Next, complete checkout for full access to 完美的胖达
Welcome back! You've successfully signed in.
Success! Your account is fully activated, you now have access to all content.
[转]数据垄断和信息孤岛,是如何驯化我们的?

[转]数据垄断和信息孤岛,是如何驯化我们的?

. 20 min read

原文链接

正如我早就告诉大家的那样,我们要建立自己的信息获取渠道,不要任由别人投喂。
要记住,被投喂的唯一结果就是变成猪,不是吗。
如何建立渠道请看我的RSS相关文章。
按道理我应该在这里提供链接,但是我想如果你找不到的话你就别费姥姥劲了,乖乖被投喂吧。
主动获取信息也是需要能力的。

以下原文:


最近,百度又挨骂了。

有文章称,百度搜索为自家产品 (百家号) 引流,致使搜索结果充斥着大量质量低劣的信息,已经沦为营销号的平台。

不少朋友问我怎么看,我有点诧异:

百度不是做贴吧、网盘和输入法的吗?怎么还有搜索功能?

好吧,开个玩笑。

不过说实话,近10年来我基本没有用过百度搜索。上一次打开,应该还是用来测网络连接。

不用的理由也很简单,主要倒不是因为广告,而是因为百度的内容实在太低劣了。

举个例子:就在写文章的此刻,我特地打开了百度搜索,搜了下“2018年GDP”。结果是, 第一页9条结果 (不算中间的各地新闻) ,只有2条能告诉我,统计局21日刚公布的18年中国GDP是多少。一不留神,很可能就错过了

其他内容都是什么呢?超过一半是百家号的内容。

不是说百家号一定是营销号。但在这种场景下,作为一个普通用户,需要的是第一时间的触达,是权威媒体的一手信息,可靠的事实报道,严谨的数据呈现,而非自媒体们过时、没有门槛和信用背书的“评论”。

再举个例子。我随便在百度百科中搜索“斯坦福监狱实验”,看到的内容,是一篇没有数据、没有参考材料、没有任何学术性、充斥着大量可疑描写的东西。它的出处是什么呢?是一名豆瓣用户发的帖子……

至于对这个实验的各种引用和讨论,学界的相关研究,包括18年中撼动整个心理学界的“骗局”争议,以及菲利普·津巴多本人在知乎亲自撰写的回应,当然全都没有。

至于竞价排名、莆田系等问题,大家都已经熟知,就不说了。

很多人为百度开脱,说,一款产品,为自家的产品引流,有什么大不了的吗?其他公司不都一样?

但这正是最值得警惕的问题:

作为国内最大的搜索引擎,百度拥有实际上的信息垄断权力。

每天,可能有数以千万计的人从百度获取信息。这种垄断的权力,一旦被不当利用,跟利益挂钩,后果会有多可怕

所以,我在以往的文章中,才一直呼吁:不要盲信百度。浪费时间精力倒是小事,更严重的后果是, 它可能会降低你对信息的“品味”。

什么意思呢?长此以往,你可能会习惯低劣的信息。不再去要求严谨的论据,可靠的事实,精确的数据,中立的描写,严格的出处……习惯这些似是而非、片面简单的碎片内容。

这才是最可怕的。

但是如题目所言,这篇文章并不是为了骂百度。反正骂了也没有用,有用的东西又不能说。

我想和你聊的,是这背后折射延伸出来的一些问题。

众所周知,对于搜索引擎来讲,第一页的流量可能是第二页的数百倍,而在第一页里面,前几个链接的流量,又远远超过末尾的链接。

可以说,排序就是一切。

这已经成了衡量搜索引擎质量的一个指标。有一个段子是这样说的:把一样东西藏到哪里可以确保不会被人发现?谷歌搜索结果的第二页。

但是,越靠前的链接,就一定越好、越符合我们的需求吗?

在传统媒体中,决定版面位置的是编辑,这就是传播学里面的“把关人”效应 —— 你所看到的一切东西,都是媒体编辑想让你看到的。

哪怕再公正、再客观的媒体,只要是“人”去操作,就存在“把关人”问题。

但把人换掉会更好吗?未必。

如果说搜索引擎排序的依据是算法,我们又凭什么去相信算法的完善、严谨,以及,相信算法背后的公司?

不说百度,就连谷歌,也遭受过许多质疑。

2016年美国大选期间,知名视频博主 SourceFed 就曾爆料,称谷歌屏蔽希拉里负面搜索建议。后来谷歌也作了回应,表示:当用户在谷歌搜索的时候,有关负面的建议词 (像 crime 等词汇) 会被自动降权,并无针对性。

但美国心理学家、Psychology Today 的前主编 Robert Epstein 做过实验后,认为:SourceFed 的爆料大体是正确的,只是有点夸大。他认为,谷歌在对待希拉里和特朗普的搜索建议上,确实不太公平,对前者的负面屏蔽要比后者多。

Robert Epstein 认为,如果此事属实,靠这个细微的区别,可能影响 80~320 万张选票。

2017年,欧盟反垄断委员会对谷歌罚款27亿美元,理由就是:谷歌涉嫌干预搜索结果,将用户引导向自己的服务,而将竞争对手的链接放到靠后的位置。这导致谷歌当年度收入受到重创。

2018年8月,美国中期选举前不久,媒体 PJ Media 发表了一篇文章,声称,在谷歌上搜索“特朗普新闻”相关关键词,排序靠前的结果中,有96%来自左翼媒体,占比最大的是和特朗普关系最差的 CNN。

这当然有许多可能性——比如左翼媒体会更关注特朗普的过失,相对报道量更大,点击量也更高——但值得警惕的是: 哪怕是地球上最好的搜索引擎,也会受到种种质疑和争论,更何况其他产品

无论多么伟大的产品,一旦拥有了垄断的权力,结果都是可怕的。

没有任何一个媒体能像谷歌一样,能够干预数十亿人的信息接收,影响数十亿人的思维、认知,但问题是,又有谁来监督和约束谷歌?

同样,当百度垄断了你获取信息的渠道,当你习惯了不动脑子的吸收,你所看到的,就永远只是别人想让你看到的东西。

在你点开搜索引擎第一页的结果时,有没有想过:这些结果可能是受到干预的?有些东西可能是人为想让你看到,而有些东西,可能你永远看不到。

倘若首页超过50%的结果,被换成了自家的产品,那原本那些位置上放的是什么?它们又去了哪里?

如果盲信别人为你递上的结论,就相当于把思考和判断的权利,拱手让给了别人。

这只是一方面,另一方面,是互联网的开放性。

搜索引擎的本质驱动是什么?是互联网的开放性。可以说,如果没有开放性,搜索引擎的根基就会受损,从而也就没有了存在的理由。

但互联网真的是开放的吗?

如果把诞生于1995年的雅虎算作第一个搜索引擎,至今也有23年了。那时还是 Web 1.0 时代,万维网刚具雏形。整个互联网就是一个平面的数据库,由各种彼此跳转的超链接文本组成。

一切信息都是开放的,可链接的,可触及的。而搜索引擎,就是这个数据库的目录。

但从 Web 2.0 开始,事情发生了变化。

互联网厂商开始“圈地”,开始由平面向着立体进化,建筑起自己的一个个仓库。互联网的开放性被消解了,开始产生隐私、封闭性和信息壁垒。

为什么?很简单,因为大家开始意识到“数据”和“流量”的价值。

举个例子。我在公众号写过200篇文章,100多万字,但无论是用百度、必应还是谷歌 (除了搜狗) ,都是几乎搜不到的,仿佛它们从未存在过。

同样,如果我想在这篇文章中,插入一些外部的链接,比如论文、网址,也是做不到的。我只能直接粘贴整个链接,再让读者手动选择、复制,跳转到浏览器里打开。

这就是微信公众号的封闭性。

不仅如此,微信对 API 把控得非常严。有一些抓取公众号文章,转化为 RSS 阅读的产品,出来后都会遭到针对性的封杀和升级应对,就是为了保障这种封闭性。

有了封闭性,数据就会被圈定在产品之中。你就必须每天都打开它,使用它,久而久之,习惯它,成为它的流量。

为什么所有的互联网产品都在推出APP,都希望你去使用它们的移动应用?就是因为,使用APP,你才能老老实实地“待”在里面,成为一名可量化、可跟踪的用户,而不是像网页一样,跳转、迁移、难以捉摸。

移动互联网有一个术语,叫做“激活成本”,指的就是获取一个有效用户的平均成本。这个指标从五六年前的几毛钱、几块钱,飙升到今天的几百块,仍然有无数公司在这片血海里厮杀,无非都是有利可图。

正是这些封闭的系统,把整个互联网,变成一个个的“信息孤岛”。

今天,我们手机里有各种各样的APP。想知道附近有什么吃的,打开大众点评;想买东西,打开淘宝、京东、亚马逊;想看看大家都在关注什么,打开微博;无聊了,打开朋友圈……

但这些独立的APP之间,信息能够互通吗?当然不能。

别说互通了,你的朋友圈能导出吗?你的微博能导出吗?你的淘宝搜索记录、浏览记录能导出吗?都不能。

甚至,根据微信的协议,我们的微信号并不属于我们,它是腾讯的资产,我们只有使用权。

我们产生了几乎无限的数据,根据这些数据,互联网厂商们可以精确地知道我们的爱好、习惯、行为,从而给我们推送精准的服务和广告。

而我们对这些数据,连基本的所有权都没有。

它们掌握在谁的手里呢?互联网巨头。为了从数据中攫取利益,巨头们营造出一个个信息孤岛,把信息进行割裂,树立壁垒,实现垄断,把我们“圈养”起来。

正如哥伦比亚大学法律系教授 Tim Wu 在《大变迁》一书中所说:通信技术的每一次主要变迁都遵循着相似的模式:最先出现的是短暂却足以让人感到兴奋的开放性阶段,随后带有垄断性质的封闭性阶段会逐渐取代前者。

Medium 的创始人 Ev Williams 对此深有同感。他经常引述 Tim Wu 的观点:

不论是铁路、电力、电报还是电话,这些事物最终都朝着封闭和垄断的阶段迈进。而且不论政府是否进行干预,在网络效应和规模经济效益的复合作用下,这个进程总会上演。

互联网早已失去了开放性,它正在走向封闭。

在数据垄断和信息孤岛的分割下,互联网基本被割裂成了这几块:

信息海:完全开放的各类公开信息,也是唯一能被搜索引擎检索到的。

社交圈:微博、朋友圈、Twitter、Facebook等社交平台的信息。

垂直管:大众点评、美团、淘宝等生活所需的产品。

内容墙:视音频等多形态的内容产品,以及由付费制、会员制所隔绝出来的内容供应。

巨头们在做的事情,就是把各个“孤岛”聚合成“群岛”,并划分出自己的地盘,跟对手角力。

猜一猜,谷歌最大的竞争对手是谁?

不是百度,不是苹果,当然也不是亚马逊,而是 Facebook。

原因很简单。这两家公司的主要营收都来自数字广告。根据谷歌和 Facebook 的 2017 年财报,两者的收入中,有 80% 来自广告业务。

另一个数据:按 eMarketer 的估算,2018 年,谷歌的数字广告营收额将占整个美国市场的 37.2%,Facebook 预计将占 19.6%,两者加起来瓜分了超过一半的市场份额。

这就导致了谷歌和 Facebook 之间势如水火的局势。如今,两者的全球用户早已超过10亿,每天产生难以计量的数据,但在谷歌上,你是找不到 Facebook 的任何内容的 —— 因为 Facebook 不开放接口。

这就是“信息海”和“社交圈”之间的战争。谁能吸引更多的注意力,更多的用户时间,谁就能获得更多的数据,攫取更多的利益。

所以,为什么谷歌一直在做社交产品?就是为了分一杯羹。

并不只有 Facebook 在构建封闭的商业帝国,谷歌也是。

2012 年,谷歌打造了自己的“知识图谱”项目。 这个项目旨在为用户呈现更快、更有效的搜索结果,但与此同时,也让互联网变得更封闭

什么意思呢?当你用谷歌搜索的时候,你可能会发现:有许多相关的信息,会直接以片段的形式,呈现在搜索结果页面上 —— 你无须再去点击任何链接了。

比如,搜索一位名人,你会在右边看到他的简要信息、最新动向,以及一些相关问题。这些信息是怎么来的呢?通过“知识图谱”,从其他网站直接抓取来的。

这正是 2005 年谷歌 CEO Eric Schmidt 所说的愿景:谷歌的理想图景,是让搜索结果直接回答用户的问题,不需要再点击链接。

本质上,这和 Facebook 是一样的: 让数据和信息在内部流动,形成一个封闭的闭环

他们正在不遗余力地“驯化”用户,让用户不再需要去行动和思考。

在这种情况下,自力更生,学会动手解决问题,就显得更加重要。

但可怕的是,我们也许已经习惯了被工具塑造,而遗忘了:我们才是工具的主体。我们使用工具,是为了更好地达成需求。

不久前,我做了个实验。我随机问了20位微信联系人。这里面,有不同年龄、不同工作的人,有关注了我公众号的,也有压根不知道我是谁的。

我问他们:你看订阅号时,会不会去点击右上角的菜单,从订阅号列表里去找你想看的号?

结果是什么呢?0。这 20 人中,没有一个人会主动去“搜寻”信息,全都习惯了被动刷信息流。

而这仅仅是多点一步操作而已。

这个实验当然不严谨,但可想而知,在日常生活中,当我们需要解决问题时,有多少人会具备“主动”意识 —— 主动搜寻信息、整合信息、对比信息、反思信息,而非习惯了被信息所喂养。

我将获取信息的形式,分成三个层级。

第一个层级,是被动接受。不思考,不搜寻,不加工,遇到问题只会去询问别人,然后相信别人给你的内容。

第二个层级,是主动搜索。会通过不同渠道获取信息,但容易止步在“认知边界”之内,只相信自己已经相信的东西,只看到自己能看得到的东西。

第三个层级,是批判整合。在第二层级的基础上,会对信息内容进行批判审视,会跳出舒适区,找到对立面,会不断刷新自己的信息渠道和信息整合能力,从而获取更全面、更高层次的理解。

你处在的是哪一个层级?

很多人缺的,未必是搜索信息的能力,而是搜索信息的意识。我们习惯了相信别人,吸收别人告诉我们的结论,但却很少去反思、质问、对比、整合。

长此以往,我们会怎么样呢?被掌握了数据垄断和信息孤岛的巨头们所驯化。

他们用算法圈养我们,用兴趣吸引我们,用便利性让我们放弃对抗,用引导和喂养让我们放下思考。

慢慢的,我们会变成亿万数据当中,那一枚小小的碎片。

最后,提几个小建议。

我们难以改变外在环境,但可以不断去提升自我。比如:

1. 提高搜索意识

即使前文提到过谷歌的种种争议,它仍然是全世界最好的搜索引擎。有条件用谷歌,没有条件用必应也行。

另外,学一些英语,在搜寻信息时,用中文和英文分别搜一下,对比一下,你可能会有更大的收获。

最重要的,是具备搜索信息的主动性。不要止步于最容易获得的内容,而是进一步思考:

这些信息是我要的吗?可靠吗?有效吗?

我还可以从哪里获取信息?

我还需要什么信息,来丰富、支撑和补充它们?

不仅仅局限于搜索引擎,也不仅局限于文本,书籍、音频、视频……这些都是信息的载体,都可能为你提供答案。

要有足够强的求知欲,不要满足于轻易能得到的信息,不妨多去深究和探索。

如同我在许多文章里强调过的:读书不要追求“读完”,它的本质是搜寻信息。

理解了这一点,你或许会有全然不同的视角。

2. 建立自己的信息库

我有一个习惯:用谷歌搜索时,链到了一个网站,如果信息质量过关,我一定会把这个网站存下来,把它摸清楚,了解它的内容品味、倾向和类别。

然后,把它纳入我的信息库里面,需要时,直接去上面找。

这其中,有许多网站是注册制的,有些甚至是付费制 —— 它们的绝大多数内容不会被谷歌所检索,你必须自己去挖掘和发现。

日积月累,这个庞大的信息库,就会成为可靠的信息来源。

如果你习惯了从门户网站、搜索引擎找信息,不妨先从践行这个习惯,落实信息库开始。

3. 完善内在的知识体系

我在以前的文章中,多次提到过“反脆弱性”—— 即使绝大多数信息都可以从外部得到,我们也不能掉以轻心,完全把记忆、理解和思考交给它们。

为什么?原因很简单:我们能从外部得到的,永远只能是“信息”而非“知识”。

这些信息能构成什么结构,导出什么结论,采取什么态度,推出什么行动……这些,必须借由自己的知识体系进行加工才行。

你自身的知识体系越壮大,越完善,对外界信息的理解和吸收就会越全面、越高效。

那么,如何构建自己的知识体系呢?简单来说,就是三个步骤:

1)复述,用自己的话重构和提炼信息。

2)联系,把新信息跟旧信息联系起来,构成新的主题和框架。

3)更新,不断打破已有的结构,把新的节点纳入进来,使它更丰富和完善。

4. 保持怀疑和审视

人永远无法克服大脑的缺陷,永远没有办法做到100%的理性、客观、中立。

那么,最好的办法,就是永远“留有余地”。

永远记住“我可能会犯错”,不断去问“有什么新的证据”,多去寻求对立面,打破自己的固有认知。

互联网会走向封闭,但我们的大脑可以保持开放。

没有什么是绝对正确的,如果有,那也只是怀疑本身。