在外行眼里统计学家经常做的一件事就是把一大堆杂七杂八的数据放在一起,算出几个莫名其妙的数字,然后再通过这些数字推理出貌似很靠谱的结论,简直就像是炼金术士用“贤者之石”把一堆石头炼成了金矿。第六章,应该是全书最抽象的一章,就是介绍统计学中的“贤者之石”——数据简化原理。从蕴含信息的角度看,样本全体蕴含了所有的信息,但是这些信息过于分散,研究起来无从下手,必须有简化样本的手段,把分散在每一个样本的信息聚集起来。这里的聚集是一对矛盾的对立统一体,即样本简化和信息损失的对立统一,这一章便从理论的高度探讨如何把握这一对矛盾对立统一体。下面是这一章的思维导图,