第四节 对大数据革命的几点理论感悟

在万物互联的时代,任何行业都具有互联网属性,都会成为大数据行业。当离线的物理世界被迁徙到在线的虚拟网络世界时,人类一切活动的动机、偏好、目的、过程等都可以通过大数据和人工智能而得到一定程度的描述,此乃产生“数据与数据对话”的现实背景。人类通过大数据可以获取完备信息的事实,会导致经济学基础理论改变分析假设[11]。经济学改变假设前提对于微观经济分析来说是革命性的,它会引发经济学家对选择偏好、认知和效用期望等的重新思考,引发经济学家创新理性选择理论,从而重塑微观经济学的分析基础。微观经济学的精美理论大厦是建立在信息不完全假设之上的,在未来的“数据与数据对话”时期,按照未来学家对大数据的解构,假若一切有机体和无机体都将成为一种“算法”,那么,经济学的分析假设问题就有必要在新科技运用层面上展开深入的讨论。

我们正处在“人与数据对话”走向“数据与数据对话”的互联网应用扩张时期,本时期新科技运用层面的最核心内容,是人类采用何种方法和手段挖掘、搜集、整合、分类、加工和处理大数据,最主要特征是智慧大脑如何运用人工智能来匹配作为决策依据的大数据。这里的大数据由历史数据、现期数据和未来数据三大部分构成。值得我们研究的是,无论是挖掘、搜集、整合和分类大数据,还是加工和处理大数据,都离不开云计算、机器学习、物联网、区块链、语音识别、无人操控、指纹鉴定等人工智能技术。就“人与数据对话”走向“数据与数据对话”来讲,在云计算水平达到一定高度的情况下,这种“对话走向”的速度快慢以及覆盖面大小,在很大程度上取决于机器学习水平。针对新科技进步会引致微观经济学分析基础变化的情形,我们要实现对未来“数据与数据对话”的理论解说,需要重点关注作为人工智能最主要手段的机器学习如何挖掘和匹配大数据,如此,我们才能抓住互联网应用扩张与微观经济学基础关联的分析主线。

在互联网应用扩张时期,机器学习可通过“算法”找到加工和处理大数据的人工智能方法(Taddy,2017);按机器学习的特征,有监督学习、无监督学习、强化学习和深度学习等类型的划分(Lecun,2015)。经济学家可以通过机器学习来挖掘和匹配已发生的历史数据,对资源配置和产业组织状况进行实证分析,这可以作为经济学家运用大数据思维取代以部分信息为依据的因果思维的例证。但对于正在发生的现期数据和尚未发生的未来数据,如果机器学习仍然处于“人与数据对话”阶段,经济学家即便全面使用了依据神经网络架构将低层级特征数据组合成高层级特征数据的深度学习方法,也难以挖掘、搜集、整合、分类、加工和处理现期数据和未来数据。从机器学习的技术条件配置以及机器学习涉及的场景考察,人工智能有效匹配现期数据和未来数据,只能出现在“数据与数据对话”时期。因此,经济学家重塑理性选择理论、资源配置理论和产业组织理论有待于机器学习方法的拓展和深化。

人类是否能够探索出一种匹配现期数据和未来数据的机器学习方法,是计算机和人工智能专家的任务。对于经济理论研究来说,基于“数据与数据对话”是人类未来发展的趋势,经济学家必须对这种趋势具有前瞻性,要能够借助最先进的机器学习方法所取得的成果来进行研究,从而实现理论研究的大数据化。本章的分析基点和分析结论是建立在“数据与数据对话”版本之上的,以这个版本所反映的互联网应用扩张对人类选择行为的影响而言,它集中表现在信息的提供和处理方式以及对选择偏好、认知和效用期望等的“革命”上。经济学的理性选择理论主要是“人与信息对话”版本的产物,它不可能解释“数据与数据对话”版本下的选择行为。这便给我们的理论研究提出这样一个要求:完成互联网应用扩张下微观经济分析基础的创新,首先需要创新经济学的理性选择理论。

本章将互联网应用扩张下的行为主体划分为智慧大脑和非智慧大脑的二元结构,并在此基础上对创新理性选择理论、资源配置理论和产业组织理论等所展开的分析,一是基于大数据和人工智能将会改变经济学分析框架的前瞻性考虑,另一是基于大数据和人工智能对传统产业冲击之实践的考虑。智慧大脑试图通过对大数据的搜集、整合、分类、加工和处理以获取准确信息,这种方式与智慧大脑运用机器深度学习和强化学习是相伴而行的。例如,众所周知的AlphaGo和Master与世界顶级棋手的对弈,就是智慧大脑通过对大约30万幅围棋谱之大数据的挖掘和处理,用无数台服务器对这些数据展开深度学习,再通过强化学习训练出进一步支撑人工智能的新数据而战胜世界顶级棋手的。这里的30万幅围棋谱是历史数据,这里的“新数据”则可看成通过深度学习和强化学习的融合而从历史数据中提炼的未来数据。在未来,当智慧大脑借助这种融合使一切有机体和无机体都成为一种“算法”时,人类便实现了以“数据与数据对话”为背景的人工智能产业化。

人工智能产业化的初级阶段出现在消费和服务领域,中级阶段出现在制造和基础设施领域,顶级阶段则是出现在医疗和生命科学领域。就此而论,“数据与数据对话”也存在与此对应的三个阶段。对于经济理论研究来说,经济学家要关注“数据与数据对话”如何改变微观经济运行方式,关注如何重塑理性选择理论、资源配置理论和产业组织理论。大数据应用的起点是“人与数据对话”,终点是“数据与数据对话”,它对经济活动最基本的影响是将改变人类资源配置手段;各行各业在大数据的导引下会形成由互联网竞争平台驱动的新产业组织(结构)机制。目前,经济学界还没有对大数据应用扩张会重塑微观经济学基础展开专门研究,本书也只是提出一些思路。事实上,“互联网网络化→智能数据化→人工智能自动化”已成为人类经济、政治、军事、文化等领域将来发展的必然趋势。就产业组织变动来讲,任何行业都可以通过人工智能化使其产业组织由原先的垂直整合架构转变成网络协同架构。

总之,经济理论研究关注的最基本问题,是人类进入“数据与数据对话”版本后能否提供完全信息。若能够提供完全信息,信息经济学和博弈论将失去科学基础,而以不完全信息为假设前提的主流经济学大厦将会被颠覆。最近,国内经济学家与深谙智慧大脑的人士之间,爆发了一场将来能不能实行计划经济的争论。经济学家从理论和历史实践强调计划经济的不可行,而推崇智慧大脑的人士则从大数据有可能提供完全信息角度出发,认为计划经济存在可行性(后面章节将重点讨论)。实际上,资源配置存在合理、准确和精准之三大层级,在“人与信息对话”时期,人类充其量只能实现合理配置资源;在“人与数据对话”时期,人类有可能实现准确配置资源;在“数据与数据对话”时期,人类才有可能精准配置资源。人类只有实现了精准配置资源,才具有计划经济的可能性。因此,这个问题的讨论最后还是要回到“数据与数据对话”这个未来趋势的研究上来。

大数据革命所呈现出的“人与数据对话”以及“数据与数据对话”两大版本,是对互联网、大数据、云计算、物联网、机器学习、区块链等人工智能技术之广泛运用的理论描述,这些新科技的广泛运用是与互联网应用扩张相伴而行的,这是问题的一方面。另一方面,大数据革命会逐步使厂商、个人和政府形成大数据思维。有必要指出的是,大数据思维是新科技代表的新兴人文主义的基础;在未来,厂商、个人和政府在大数据思维下的经济决策行为,则是大数据革命的具体实施过程,而这一过程将会给经济学创新提供现实依据。

政府规制政策和手段难以解决市场失灵问题,部分归因于产品和服务供求数量的“算法”对数据智能化同样有极高的要求,部分归因于网络协同化对企业投资经营的极高要求,部分归因于只有极少数企业能够实现网络协同效应的事实。我们不主张政府对大数据时代的产业垄断实施规制,暗含着以下几个基本假设:大数据时代能够成为产业垄断的企业,一定是具有极强数据智能化能力和极强网络协同化能力的企业,一定是能够实现网络协同效应的企业,一定是能够在云端运用人工智能匹配大数据,从而把产品和服务供求量的确定转变成“算法”的企业。这样的企业是优化资源配置在先,并且时刻受到网络协同效应的约束,它不可能长期利用价格确定权和进入门槛来维系自己的市场势力。当然,大数据时代的产业垄断企业在将来会不会出现有损于社会福利的弊端,尚有待未来实践的检验。

本章关于大数据时代产业垄断形成机制的分析,是以不久的将来会出现大数据、互联网、机器学习等人工智能技术的深度融合为前提的。事实上,大数据时代许多行业所构成产业垄断的资金门槛、技术门槛和政策门槛,有着明显降低的趋势,这种局面形成的主要原因是数据智能化和网络协同化使企业能够获取供给和需求的准确信息,互联网和物联网的运行使企业能够跳越中间商而直接把产品和服务提供给消费者,是企业能够通过机器学习降低产品和服务的研发成本,是企业能够通过数据智能化解决以前难以解决的技术问题,是企业能够通过网络协同化让场景复杂的外部性统一于实时在线的具有协同效应的网络平台。基于数据智能化和网络协同化将逐渐成为产业垄断主导因素的情形,政府在工业化时代的产业规制政策的理论依据开始慢慢失去了现实的支持。也就是说,现有的产业规制政策和手段对具有数据智能化和网络协同化基因的产业垄断的规制作用,将不可避免地会受到限制。

中国现阶段的大数据、互联网、机器学习等人工智能技术的融合正向深度和广度行进,但从大数据中获取准确信息,从而将一切有机体和无机体的存在和发展都转化为“算法”的时代还为时尚早。因此,真正大数据意义上的产业垄断在现实中暂不存在,本书只是对产业垄断形成机制做出的一种前瞻性研究。不过,这项研究给我们留下两大值得思考的问题:一是对于大数据时代有可能出现的产业垄断,究竟要不要进行产业规制以及怎样规制;二是大数据时代的产业垄断会不会减少消费者剩余和降低社会福利。显然,对这两大问题的深入研究,需要等到数据智能化和网络协同化在微观经济运行中全面展开后,才能给经济学家提供理论分析和实证分析的素材。