收藏本页 打印 放大 缩小
0

为什么读《为什么》

发布时间:2019-12-20 08:55:42    作者:    来源:中国银行保险报网


作者:(美)朱迪亚·珀尔 达纳.麦肯齐
翻译:江生 于华
出版:中信出版社
时间:2019年7月
定价:69元

□王和

这是一本新的不能再新的书,原版是2018年,中文版是上个月,2019年7月由中信出版社出的,却谈了一个老的不能再老的话题:为什么。这本书的主要作者:朱迪亚·珀尔,大多数人也许不熟悉,但你可以通过两个“头衔”,对他有一个初步的了解,一是“贝叶斯网络”的研发者;二是“图灵奖”的获得者。

尽管珀尔希望把这本书写成一部“因果关系”的科普书,并给本书加了一个副标题:“关于因果关系的新科学”,但一般人读起来还是有一点难度,因此,主要是推荐给从事相关领域工作的人,如精算和统计分析人员。其他人,只要“走马观花”地读读即可(其实,我也没有看得很明白),关键是了解和理解问题提出的大背景,以及本书的核心观点和主要结论,以此丰富自己观察、思考和认识问题的视角。

“为什么”一直是人类社会的“大问题”,关注和思考这个问题,是人类社会文明与进步的动力和表现。人们通过“为什么”,对一个个结果的追问,去认识自然,认识规律,从而丰富知识,理性生活,用中国传统文化的表述,叫“格物致知”。

珀尔的核心观点是:传统的统计学用相关性分析不足以回答“为什么”,而认识并回归因果关系才是正道和正解,为此,他提出了一系列概念和名词,如“因果革命”“因果语言”“因果推断”“因果模型”“因果透镜”“因果直觉”和“因果幽灵”,其中,最重要的是“因果图”。在珀尔看来,统计技术,也包括回归分析,并不能很好和真正解释并回答“为什么”,尤其是在“混杂”,即“多因多果”的情况下,而“为什么”的本质是一种定性活动,只有通过“因果图”,通过“因果关系之梯”,探究“因果关系”才能够解决。

在本书中,珀尔用了很大的篇幅,包括运用了大量悖论,证明传统统计,尤其是“相关关系”的局限性,其实,统计学的局限性是显而易见的,如在开展问卷调查的过程中,问卷本身就具有设计者的“主观局限”,同时,被调查者往往也属于一定的“组别”,即调查本身就将对象“同质化”了。这种调查,要么是得出一个众所周知的常识,要么是服务于预设的结论。有的时候,你会觉得经济计量,好像已不再是为了发现什么,而只是为了证明什么,甚至只是为了向别人“证明”什么,于是乎,被越来越“神话”了,成为了“自欺欺人”的神器。另外,珀尔希望人们更多地关注“反事实”问题,并能够透过“反事实”看到背后的“中介”因素,通过中介分析,实现因果关系的回归。

本书希望能够给人们的一个重要启示是:敬畏因果。传统统计学,乃至金融和经济学是不太接受“因果”,如统计学的传统教育是讳忌讨论因果的。珀尔认为经典统计学只关注总结数据,而他认为:思维胜于数据,因为,数据不了解因果,而人类了解。统计学和概率论只是解决“可能”问题,而因果解决“必然”问题。用休谟的话说是:假如没有前一个对象,那么后一个对象就不可能存在。

本书的核心诉求应当是证明“因果关系”的存在与发现,而通篇读下来,好像仍缺点什么,所以,如果有机缘,珀尔真应当了解了解中国传统文化,读一些佛经,以便实现对因果关系的皈依。中国传统文化,尤其是佛学是非常重视“因果关系”的,强调“有一果必有一因”,反之亦然。同时,强调“因果相报”,并将这种“因果关系”引申为“轮回”,在中国人看来,“因果”是世界和社会的存在基础,“报应”是因果的具体表现,“轮回”是最大的因果关系,更重要的是:中国人不是就事论事地谈因果,而是希望通过对因果、报应和轮回的理解和解释,建立起一种敬畏,一种对时间和天道的敬畏,因为,人在做,天在看。所以,出来混,都是要还的。

 

节选:因果革命

今天,这种以数据为中心的观念仍然阴魂不散。我们生活在一个相信大数据能够解决所有问题的时代。大学中“数据科学”方面的课程激增,在涉足“数据经济”的公司中,“数据科学家”享有极高的工作待遇。然而,我希望本书终能说服你相信这一点:数据远非万能。数据可以告诉你服药的病人比不服药的病人康复得更快,却不能告诉你原因何在。也许,那些服药的人选择吃这种药只是因为他们支付得起,即使不服用这种药,他们照样能恢复得这么快。

在科学和商业领域,仅凭数据不足以解决问题的情况一再发生。尽管或多或少地意识到了其局限所在,但多数热衷于大数据的人仍然选择盲目地继续追捧以数据为中心的问题解决方式,仿佛我们仍活在因果禁令时代。

正如我刚才所说的,早过去30年里,情况发生了戏剧性的变化。如今,感谢那些设计精巧的因果模型,当代科学家得以着手解决那些一度被认为是不可能解决的甚至是超出了科学探索范围的问题。例如,仅在100年前,人们还认为“吸烟是否危害健康”这一问题是非科学的。仅仅是在研究论文中提及“因”或“果”这样的词都会在任何稍有名气的统计期刊上引发强烈的反对。

甚至就在20年前,询问一个统计学家诸如“是阿司匹林治愈了我的头痛吗”这样的问题,就会被视为相当于是在问他是否相信巫术。引用我的一位备受尊敬的同事的话,讨论这种问题“与其说是科学探索,不如说是鸡尾酒会上的八卦闲谈”。但今天,流行病学家、社会科学家、计算机科学家以及一些开明的经济学家和统计学家开始频繁地提出这样的问题,并能够借助具有高度精确性的数学工具作答。对我来说,这种改变就是一场革命。我斗胆称之为因果革命,是因为这场科学剧变真正接纳了我们人类理解因果知识的认知天赋,而不再将其拒之科学大门之外。

因果革命不是在真空中产生的;它背后有有数学工具上的发展作为支撑,这种数学工具恰当的名称应该是“因果关系演算法”。借助这种工具,我们得以解答出一些有关因果关系的棘手的问题。能向公众展示这一演算法实在令我兴奋不已,这不仅是因为它拥有跌宕起伏的发展史,更是因为我真心期待未来某天它能在某些人那里发挥出我的想象的潜力……也许就出自本书读者之手。

因果关系演算法由两种语言组成:其一为因果图(causaldiagrams),用以表达我们已知的事物,其二为类似代数的符号语言,用以表达我们想知道的事物。因果图是由简单的点和箭头组成的图,它们能被用于概括现有的某些科学知识。点代表了我们目标量,我们称之为“变量”,箭头代表这些变量之间已知或疑似存在的因果关系,即哪个变量“听从于”哪个变量。这些因果图非常容易绘制、理解和使用,读者将在书中看到许多此类因果图的示例。这么说吧,如果你会使用基于单向街道地图的导航系统,你就一定可以理解因果图,继而也就可以独自解决本书导言中提出的那些关于因果关系的问题。

虽然因果图是本书选择使用的主要工具,也是我过去35年的研究主题,但它并不是可用的因果模型。有些科学家(比如计量经济学家)喜欢使用数学方程;另一些研究者(比如计量经济学家)则更倾向于借助一组假设来描述问题,这些假设表象化地概括了因果图的关系结构。但不管使用哪种语言,因果模型都应该描述,哪怕是定性地描述数据的生成过程,换句话说就是那些在环境中控制并塑造数据生成的因果力量。

(节选自《为什么》)

 


为什么读《为什么》

来源:中国银行保险报网  时间:2019-12-20


作者:(美)朱迪亚·珀尔 达纳.麦肯齐
翻译:江生 于华
出版:中信出版社
时间:2019年7月
定价:69元

□王和

这是一本新的不能再新的书,原版是2018年,中文版是上个月,2019年7月由中信出版社出的,却谈了一个老的不能再老的话题:为什么。这本书的主要作者:朱迪亚·珀尔,大多数人也许不熟悉,但你可以通过两个“头衔”,对他有一个初步的了解,一是“贝叶斯网络”的研发者;二是“图灵奖”的获得者。

尽管珀尔希望把这本书写成一部“因果关系”的科普书,并给本书加了一个副标题:“关于因果关系的新科学”,但一般人读起来还是有一点难度,因此,主要是推荐给从事相关领域工作的人,如精算和统计分析人员。其他人,只要“走马观花”地读读即可(其实,我也没有看得很明白),关键是了解和理解问题提出的大背景,以及本书的核心观点和主要结论,以此丰富自己观察、思考和认识问题的视角。

“为什么”一直是人类社会的“大问题”,关注和思考这个问题,是人类社会文明与进步的动力和表现。人们通过“为什么”,对一个个结果的追问,去认识自然,认识规律,从而丰富知识,理性生活,用中国传统文化的表述,叫“格物致知”。

珀尔的核心观点是:传统的统计学用相关性分析不足以回答“为什么”,而认识并回归因果关系才是正道和正解,为此,他提出了一系列概念和名词,如“因果革命”“因果语言”“因果推断”“因果模型”“因果透镜”“因果直觉”和“因果幽灵”,其中,最重要的是“因果图”。在珀尔看来,统计技术,也包括回归分析,并不能很好和真正解释并回答“为什么”,尤其是在“混杂”,即“多因多果”的情况下,而“为什么”的本质是一种定性活动,只有通过“因果图”,通过“因果关系之梯”,探究“因果关系”才能够解决。

在本书中,珀尔用了很大的篇幅,包括运用了大量悖论,证明传统统计,尤其是“相关关系”的局限性,其实,统计学的局限性是显而易见的,如在开展问卷调查的过程中,问卷本身就具有设计者的“主观局限”,同时,被调查者往往也属于一定的“组别”,即调查本身就将对象“同质化”了。这种调查,要么是得出一个众所周知的常识,要么是服务于预设的结论。有的时候,你会觉得经济计量,好像已不再是为了发现什么,而只是为了证明什么,甚至只是为了向别人“证明”什么,于是乎,被越来越“神话”了,成为了“自欺欺人”的神器。另外,珀尔希望人们更多地关注“反事实”问题,并能够透过“反事实”看到背后的“中介”因素,通过中介分析,实现因果关系的回归。

本书希望能够给人们的一个重要启示是:敬畏因果。传统统计学,乃至金融和经济学是不太接受“因果”,如统计学的传统教育是讳忌讨论因果的。珀尔认为经典统计学只关注总结数据,而他认为:思维胜于数据,因为,数据不了解因果,而人类了解。统计学和概率论只是解决“可能”问题,而因果解决“必然”问题。用休谟的话说是:假如没有前一个对象,那么后一个对象就不可能存在。

本书的核心诉求应当是证明“因果关系”的存在与发现,而通篇读下来,好像仍缺点什么,所以,如果有机缘,珀尔真应当了解了解中国传统文化,读一些佛经,以便实现对因果关系的皈依。中国传统文化,尤其是佛学是非常重视“因果关系”的,强调“有一果必有一因”,反之亦然。同时,强调“因果相报”,并将这种“因果关系”引申为“轮回”,在中国人看来,“因果”是世界和社会的存在基础,“报应”是因果的具体表现,“轮回”是最大的因果关系,更重要的是:中国人不是就事论事地谈因果,而是希望通过对因果、报应和轮回的理解和解释,建立起一种敬畏,一种对时间和天道的敬畏,因为,人在做,天在看。所以,出来混,都是要还的。

 

节选:因果革命

今天,这种以数据为中心的观念仍然阴魂不散。我们生活在一个相信大数据能够解决所有问题的时代。大学中“数据科学”方面的课程激增,在涉足“数据经济”的公司中,“数据科学家”享有极高的工作待遇。然而,我希望本书终能说服你相信这一点:数据远非万能。数据可以告诉你服药的病人比不服药的病人康复得更快,却不能告诉你原因何在。也许,那些服药的人选择吃这种药只是因为他们支付得起,即使不服用这种药,他们照样能恢复得这么快。

在科学和商业领域,仅凭数据不足以解决问题的情况一再发生。尽管或多或少地意识到了其局限所在,但多数热衷于大数据的人仍然选择盲目地继续追捧以数据为中心的问题解决方式,仿佛我们仍活在因果禁令时代。

正如我刚才所说的,早过去30年里,情况发生了戏剧性的变化。如今,感谢那些设计精巧的因果模型,当代科学家得以着手解决那些一度被认为是不可能解决的甚至是超出了科学探索范围的问题。例如,仅在100年前,人们还认为“吸烟是否危害健康”这一问题是非科学的。仅仅是在研究论文中提及“因”或“果”这样的词都会在任何稍有名气的统计期刊上引发强烈的反对。

甚至就在20年前,询问一个统计学家诸如“是阿司匹林治愈了我的头痛吗”这样的问题,就会被视为相当于是在问他是否相信巫术。引用我的一位备受尊敬的同事的话,讨论这种问题“与其说是科学探索,不如说是鸡尾酒会上的八卦闲谈”。但今天,流行病学家、社会科学家、计算机科学家以及一些开明的经济学家和统计学家开始频繁地提出这样的问题,并能够借助具有高度精确性的数学工具作答。对我来说,这种改变就是一场革命。我斗胆称之为因果革命,是因为这场科学剧变真正接纳了我们人类理解因果知识的认知天赋,而不再将其拒之科学大门之外。

因果革命不是在真空中产生的;它背后有有数学工具上的发展作为支撑,这种数学工具恰当的名称应该是“因果关系演算法”。借助这种工具,我们得以解答出一些有关因果关系的棘手的问题。能向公众展示这一演算法实在令我兴奋不已,这不仅是因为它拥有跌宕起伏的发展史,更是因为我真心期待未来某天它能在某些人那里发挥出我的想象的潜力……也许就出自本书读者之手。

因果关系演算法由两种语言组成:其一为因果图(causaldiagrams),用以表达我们已知的事物,其二为类似代数的符号语言,用以表达我们想知道的事物。因果图是由简单的点和箭头组成的图,它们能被用于概括现有的某些科学知识。点代表了我们目标量,我们称之为“变量”,箭头代表这些变量之间已知或疑似存在的因果关系,即哪个变量“听从于”哪个变量。这些因果图非常容易绘制、理解和使用,读者将在书中看到许多此类因果图的示例。这么说吧,如果你会使用基于单向街道地图的导航系统,你就一定可以理解因果图,继而也就可以独自解决本书导言中提出的那些关于因果关系的问题。

虽然因果图是本书选择使用的主要工具,也是我过去35年的研究主题,但它并不是可用的因果模型。有些科学家(比如计量经济学家)喜欢使用数学方程;另一些研究者(比如计量经济学家)则更倾向于借助一组假设来描述问题,这些假设表象化地概括了因果图的关系结构。但不管使用哪种语言,因果模型都应该描述,哪怕是定性地描述数据的生成过程,换句话说就是那些在环境中控制并塑造数据生成的因果力量。

(节选自《为什么》)

 

未经许可 不得转载 Copyright© 2000-2019
中国银行保险报 All Rights Reserved