• 不是随机样本,而是全体数据。
以往,只是因为“世界那么大”,我们无法获得“全体数据”,或者获取“全体数据”的成本太高,我们别无他法,只能选择“随机样本”。现在,无论是数据存储技术,还是数据处理技术,我们都具备了获取“全体数据”的能力
不是精确性,而是混杂性。
当我们因为技术能力,能够将全体数据作为观察对象时,就不得不放弃精确性了,不是不想,而是成本上划不来。
不是因果关系,而是相关关系。
因果关系虽好,但发现起来很难。世界瞬息万变,没时间等你。而相关关系是一种最为直接的预测方式,但是它必须建立在“全体数据”的基础上,否则就难免“盲人摸象”。而现在,我们具备了这种能力