8 min read

Garbage In, Garbage Out|如何用数据操纵无知

实不相瞒,我现在已经不看任何新闻了,连手机上的脸书也删了

周末刚撸完一堂叫《Calling Bullshit》的课程,2017年在华盛顿大学录制,当时无意中在推特看到,然后扫了一眼,觉得挺有意思:

其实我本人(ISTP) 比较理性思维,看东西基本抱怀疑态度,fact based 所以在这个龙蛇混杂的信息浮躁时代比较有优势;感觉真正区分人的不再是获取信息的能力,而是对信息的判断能力,不然只会一直被牵着鼻子走。

There is so much bullshit everywhere. We are drowning in bullshit.

当时第一时间分享了给身边的朋友看,还有助理;她说了一句:是的,有时候你让我去google, 我也不知道如何识别信息。

假如遇到同款疑问的,这门课就很有用了 ;相关书籍也在预售中,预计今年8月4正式推出;分享开头的第一个生肉视频:

提到其实当代很多所谓的教育,初创公司文化,杂志等真的很bs, 真心赞成。

简单分享几个最经典的bullshit套路

1)Anything seems too good to be true 任何看起来太美好的东西

这个就最简单,例如其实任何投资都有风险,那么宣称只会赚还是包赚的那种真的呵呵了。

2)Unfair Comparisons 不公平的对比

最典型的例子,对比各国GDP,就很傻,敢不敢对比人均GDP?又或者拿最近各国的疫情情况做对比,但居然按感染人数占比当地国家人数百分比来作对比? 特傻。

毕竟不同国家的总人数很不一样,例如美国感染人数的确是高,但总人口也更多;比利时感染人数明显不多,但因为总人口少,所以反倒会得出比利时的情况更严峻?

3)还有一点:新闻自由度。

可能很多人不知道国外媒体是经常夸大事实逼政府办事的,嗯,不说了。

4)Correlation and Causation 相关性和偶然性

也学了一个很有意思的拉丁文:The fallacy of post hoc propter ergo hoc.(after this, therefore because of this)

后此谬误(the post hoc fallacy) 后此(post hoc)是“后此,所以因此”(post hoc,ergo propter hoc)的缩写。 它是从拉丁文翻译而来的,整个短语意思是:“在此之后,因而必然由此造成。

例如最常见的,不小心感冒,但吃了感冒药,过二天却发烧了,所以是这感冒药引起发烧的?(这个就是很简单的后此谬误)但事实上发烧可能是感冒本身造成,不一定是因为感冒药。

社会上很多人擅长将原本毫无关联的,却取巧地设计为看起来有关联,但只要再dig deeper就可以看出背后的猫腻了

5)Fake news 假新闻

感觉大部分人已经对假新闻见惯不怪了?也是现代社会的一种悲哀。

但估计以我读者的素质,也能看出中文圈的信息水平了,各种眼球经济,标题党为了获得更多的点击量,其实还有什么不敢写?

日常最多转发的各种#震惊体 #别国要沦陷了#大国要出手了,点击量还真的特别高;所以像我们这类客观冷静分析,说实话的感觉就不怎么受欢迎了。

但你看到的也是别人想让你看到的。不过感觉其实fake news也有一个好处:能大概帮你看出对方的信息搜索&判断能力,甚至帮你判断哪些人值得交朋友。

You are the average of the five people you spend the most time with. 我们的智商基本等于身边五位的平均值。

感觉现在尤其在社交媒体平台上转发的文章,大部分人的转发更多出于signalling,更多是表达自己站台支持哪方的观点,而不是出于真正的思考。

也分享一个最近刚学到的词汇:Micro-Propaganda Machine

文章这里举了美国选举和英国脱欧的例子,就是专门有机构制造传播情绪感染力强、充满偏见的造假新闻,还特别吸精的容易引起转发情绪的,不过这个就很多国家都有。

再假的新闻,假如身边的人都在传,其实会默默成真。

推荐一本书籍 :《1984》

也推荐一部好电影:The Great Hack

一句话总结:谁得到了数据,谁就能掌管一切。

6)Chart manipulation 引用表格更高级地大胆误导

这个更有意思,尽管是同一数据也能设计出不同的结果:

例如当年苹果发布会,原本销量平平无奇,但假如用累计数据来作图,那就可以出现了很性感的“explosive growth” (爆发性增长)

累计数据,当然一直在涨,因为不会降;或通过设计不同的横坐标,可以完美误导一众吃瓜群众认为到底是哪个阶层付出更多税。

又或者近期的疫情中,通过设定横坐标中的底部时间段,也能轻松造出一种疫情在放缓的假信号,其实这个套路还蛮常见的。

再举一个例子,不同的拍摄角度也很有意思:这不正如抖音,小红书里面很多同款美女?换个角度搭配滤镜加化妆品就能解决很多问题

那么在大数据时代,作为个体应该如何应对?

课程多次提到我们该时刻自省三大问题

  • Who is telling me this? 这是谁告诉我的?
  • How do they know it? 他们怎么知道的?
  • What’s in it for them? 和他们有什么相关利益?

再补充几招私人做法

1)控制信息源

其实我基本不会花时间看被投喂的信息流。

每年订阅了很多付费资讯,因为时间宝贵,看已经被我信任的人筛选过的资讯质量有保证;对书籍的挑选我也会先看别人总结的大纲,对味的再详细看;其实能花钱找到这些人帮我过滤,已经是一笔很值得的投资。

不过感觉国内大多人还没有付费订阅的习惯,感觉还是很多人不懂其实免费才是最贵的,毕竟看不懂的盈利模式才是最可怕的;例如很多美其名的免费软件,背后在倒卖用户数据。

2)多求真

很简单,多渠道对比消息。

我一般会溯源,也就是找到最原始的信息源对比查看;例如经常在微信会有人转发特朗普的推,太夸张表述的话,我会特地去看是不是真的有这条推。。我只信任一手资讯,不然就好像小时候玩的传声游戏,传着传着整个故事就变味了。

也不要轻易传播没有fact check过的新闻。

3)提高个人判断力

多结交能给你带来不同观点的朋友,时常保持思考与清醒;多看书。

4)时刻保护个人数据 data is the new oil.

其实这个在自家知识星球已经分享了很多实用工具了,欢迎上船。

说到最后

实不相瞒,我现在已经不看任何新闻了,连手机上的脸书也删了。

只看长期有价值的东西:历史,哲学,人生类;然后找到各行业最top的人学习,感觉其它基本是不值得浪费精力的noise.精力放在哪里真的很决定认知水平,可惜绝大部分人就是很容易被奶头乐引诱。

所以说在大数据时代,控制一个人更容易了。

Stay tuned for more.