探索大数据相关关系的因果模型

发布时间:2022-12-19 作者:上海大学教授 王天恩

  大数据浪潮的冲刷将相关关系和因果关系问题全面展开,对传统因果观构成了巨大冲击,为因果模型的升级提供了历史性条件。国家社科基金优秀项目“大数据相关关系与因果关系研究”(17AZX003)从大数据作为信息数字编码发展的产物出发,展开大数据及其基本特征的哲学刻画和大数据相关关系的因果模型研究。

 

  大数据相关关系和因果关系的信息基础

 

  从传统因果观到基于当代复杂因果模型的探索,因果关系研究经历了一个曲折的发展过程。量子物理学的发展对传统因果观构成了严峻挑战。这一挑战推进了因果概念的重新刻画:原因是因素的相互作用过程,结果是因素相互作用的效应及其痕迹。因素未进入相互作用,不构成作为相互作用过程的原因;原因的作用和结果的形成实际上是同一过程的两个方面。原因和结果间的联系是必然的,这是事物过程的决定论方面;而因素和结果间的联系是或然的,这是事物过程的非决定论方面。二者构成事物过程的决定性与非决定性的具体统一。而大数据的发展则为在信息层次深化因果关系的认识,进一步展开重新刻画的因果概念,提供了全新的时代条件。

 

  大数据相关关系和因果关系的最深层次问题是大数据的信息基础。实际上,正是大数据等信息科技的发展,使信息的感受性关系性质日益凸显:信息既不是物质,又不是能量,而是基于物能的感受性关系。信息的基本特性主要包括信息的创生性、涌现性、相互性和共享性。信息的感受性关系理解,意味着大数据是信息数字编码发展的产物。作为信息的数字编码,大数据意味着在相关关系和因果关系的关联中,信息具有基础性地位。

 

  大数据基本特征的哲学理解和刻画

 

  大数据相关关系和因果关系的关键问题是大数据及其基本特征的哲学层次把握。在哲学层次深化大数据特征的理解,对于大数据概念的哲学把握具有基础意义。从哲学层次看,大数据的“4V”特征排序有更强的逻辑关联。而其含义则更加远不只是技术意义上的大规模(volume)、多样性(variety)、高速率(velocity)和价值低密度(value),而是意味着大数据的规模整全性、实时流动性、结构开放性和价值创生性。

 

  数据采集方式从抽样到自然生成,使从小数据到大数据的发展意味着数据的“自然化”。数据的自然化具有重要的存在论意蕴,大数据的“大”根本上不在于数据量大,而在于数据的完备性。正是数据的完备性,使大数据具有规模整全性。大数据的规模整全性,在直觉的整体性和概念的整体性之外,为人类认识提供了新的量化的整体性。直觉的整体性基于经验,概念的整体性基于逻辑,而大数据量化的整体性则基于数据,三种整体性意味着三种整体观照。作为整体观照的第三种形式,大数据的规模整全性为因果关系的大数据相关关系整体观照提供了新的时代条件。

 

  大数据只具有相互关联意义上的结构,作为数据之间的关系,大数据的数据结构具有相对于人的需要及其发展的开放性。由于数据之间不可能直接相互作用,因此,其所构成的只能是相关关系。大数据相关关系的丰度与大数据的结构开放性密切相关。

 

  大数据与样本数据的根本不同在于,取样构成的样本数据是干枯的标本,而自然生成的大数据是没有失活的具体数据存在,具有与对象世界过程同步的实时流动性。具有实时流动性的大数据意味着维度的充分展开,不仅从单个数据到样本数据,而且从低维大数据到高维大数据,发展出越来越深远的未来向度。

 

  信息是创生的,这使作为信息数字编码产物的大数据具有价值创生性。大数据的价值创生性意味着存在论意义上的无中生有,这为人类创构——创生意义上的创造——提供了一个发展的无限空间。可见,大数据价值创生性不仅具有重要价值论乃至存在论意蕴,而且将展开因果关系的价值维度。

 

  大数据基本特征的信息层次哲学理解,不仅展现了因果关系的信息基础,而且凸显了大数据为大自然所没有的前提性预设,从而深入涉及人类认识从描述到创构的发展。创构认识论的发展,晓示着人类活动从认识世界和改变世界发展到创构世界。

 

  大数据相关关系的因果派生

 

  大数据相关关系和因果关系的核心问题是相关性和因果性之间的关系。大数据的信息性质及其空前凸显的相关关系,促使人们对传统因果概念进行深入的反思。数据化使因果关系量化为变量之间的关系,获得了关系强度和正负性质,由此构成质性描述向量化描述的发展,为相关性和因果性之间关系的理解创造了条件。正是基于大数据相关关系,可以进一步展开和深化因果概念的重新刻画:因果关系是对因素相互作用过程与其效应之间内在关联的描述;而相关关系则是对因果派生关系的描述,这是相关关系的因果性根基。相关关系及其与因果关系的关联,正是大数据时代人们关注越来越多的难题。

 

  作为因果派生关系,相关关系包括三种基本类型:一是因素和结果间相关关系,包括直接因素和直接结果、直接因素和间接结果、间接因素与直接结果、间接因素与间接结果间相关关系;二是结果间相关关系,包括直接结果内部要素、间接结果间相关关系;三是因素间相关关系,包括现实因素间和潜在因素间相关关系。正是潜在因素之间的相关关系,为人类创构活动提供了前所未有的新空间。

 

  相关关系提供了由因素创构结果的无限空间,呈现出建立在“为什么”基础上的新的“是什么”,这正是数据物化的因果性根据;数据分析的性质是因素分析,定量分析的根基是因果关系,相关分析的依据是因果派生,这则是大数据分析的因果基础。大数据因果关系基础的廓清晓示了其深层哲学内涵。因素关系的未来空间凸显了创构认识论,因果派生关系的全数据定量分析凸显了量的整体把握,而因果关系从描述到创构的发展凸显了哲学是以满足人的需要为最终目的。

 

  由大数据相关关系的因果派生机制,可以推导出人类认识中的所有复杂相关关系,甚至包括一些尚未出现的相关关系,从而为因果模型研究奠定了新的发展基础:在描述的因果模型基础上展开创构的因果模型研究。

 

  从描述的因果模型到创构的因果模型

 

  大数据相关关系和因果关系的根本问题是如何理解和建立包含大数据相关关系的因果模型。人类因果观念经历了两次重要转换,形成了三种基本的因果观:实在论因果观、描述论因果观和模型论因果观。从实在论因果观到描述论因果观,肇因于从经典物理学到量子力学的发展;从描述论因果观到模型论因果观,则源自信息科技,特别是大数据的发展。实在论因果观是关于对象确定性联系的把握;描述论的因果观是将实在论因果观抽象为描述的产物;而模型论因果观则是描述论因果观发展到完全抽离具体经验条件而量化的结果,由此可以在信息层次大大拓展对因果关系的理解。

 

  随着大数据发展对信息的开显,从物能性因果关系到信息性因果关系的深入,在更深层次展开了因果关系研究的巨大空间,为将物能性因果关系推升到信息性因果关系,从而建立起物能性因果关系和信息性因果关系一体化的更高层次因果观念,奠定了数字数据基础。

 

  大数据相关关系具有深层因果模型意蕴,蕴含着因果时态的维度。大数据维度提升了未来向度,展开了因果时态研究的空间。从过去时推展到将来时,意味着追溯既往的因果关系量化把握和探向未来的新因果关系创构。在此基础上,不仅因果关系和相关关系及二者间相互关系可以达到更高层次的把握,而且对物理因果性和心理因果性的关系可以有更深层次的理解,对上向因果性和下向因果性及其关联机制也可以有整体的透视。心灵哲学中关于下向因果性的排除处理,肇因于在人类心灵,而不是更基本的信息层次研究下向因果性。所谓上向因果性,是从物能因素相互作用过程到信息因素相互作用过程的因果性;下向因果性则是从信息因素相互作用过程到物能因素相互作用过程的因果性。心灵哲学中的上向因果性和下向因果性研究,正是物能性因果关系和信息性因果关系的心灵层次探索。

 

  深入到更基本的信息层次,我们可以看到信息更到位的理解所带来的基本范式转换。正是从物能范式到信息范式的更深层次理解,涉及复杂因果模型的信息层面,特别是创构的因果模型及其双向循环机制。与描述的因果模型不同,创构的因果模型根植于人的需要深处的主观能动性。在描述的因果模型基础上,系统探索创构的因果模型自然而然导向双向循环因果机制的进一步研究。这是大数据相关关系基础上因果模型研究进一步的课题,可望就此在人工智能研究领域走向通用智能核心机制。

 

        《社会科学报》总第1833期5版

如需转载,请注明出处!否则保留追究的权利