机器学习如何赋能管理学研究 |
来源:一起赢论文网 日期:2024-05-11 浏览数:412 【 字体: 大 中 小 大 中 小 大 中 小 】 |
《管理世界》2023年第9期摘要:机器学习正在深刻改变管理学的研究范式与方法。如何运用机器学习更好地赋能管理学研究已经成为学术界关注的前沿热点议题。然而,机器学习在中国管理学研究中的应用仍处于初级阶段。本文基于1999~2021年发表在工商管理和会计财务两大研究领域的国内外顶级期刊的学术文献,识别了学术界借助机器学习开展管理学实证研究的4种核心途径:变量测量、事件预测(包括事件分类)、因果推断和理论构建;梳理了每个途径的代表性文献的研究主题、研究问题、数据集、机器学习算法和研究结论;提出了使用机器学习赋能管理学研究的主要策略,并讨论了中国学者运用机器学习开展中国特色管理理论研究的未来机会。本文显示:将机器学习与传统计量经济学相结合有助于做出更加精准的因果推断;机器学习能够在模式发现这一理论构建的关键步骤中发挥重要作用;将机器学习与多案例分析相结合有助于富有成效地开展理论构建。本文为如何采用机器学习提升管理学研究质量、推进管理学研究范式变革和构建中国特色管理理论提供了方法论指引和方向性启示。关键词:机器学习文献计量因果推断理论构建未来展望一、引言机器学习(Machine Learning)作为人工智能的一个重要分支(贝尔,2020),在医疗健康、金融服务、自动驾驶、市场营销等领域的应用均表现出了令人兴奋的巨大优势(乔丹、米切尔,2015),并在实践界和学术界都取得了令人惊叹的快速发展。机器学习催生的以数据、算法和算力为基本要素的计算社会科学(ComputationalSocial Science)这一新型研究范式和新兴交叉学科(陈,2018;梅森等,2014),正在极大地改变社会科学的传统研究范式和方法(郭峰、陶旭辉,2023;胡安宁等,2021;罗家德、樊瑛,2018)。因而,机器学习技术日益受到社会科学研究者的广泛关注。正如瓦里安(2014)指出,机器学习技术有助于用更有效的方式构建复杂关系。阿西和因本斯(2019)强调指出,“机器学习工具正在成为跨学科的标准”;研究者有必要摆脱对主流的“数据建模文化”(Data Modeling Culture)的排他性依赖,灵活采用基于机器学习的“算法建模文化”(Algorithmic ModelingCulture)(陈强,2021;布莱曼,2001b),并同时保留传统计量经济学的优势①。洪永淼和汪寿阳(2021c)进一步提出,“大数据与机器学习计量经济学”这一门新兴学科正在茁壮成长。机器学习技术与传统计量经济学方法的深度融合将是未来管理研究的新趋势(阿西、因本斯,2019;陈冬梅等,2020;陈强,2021)。机器学习技术、方法与工具具有一些独特优势,如从复杂高维数据环境中提取有价值的信息以更好地帮助变量测量(Variable Measurement)(洪永淼、汪寿阳,2021a,2021b),直接基于数据灵活选择函数形式和构建算法以更好地帮助样本外的事件预测(Event Prediction)(洪永淼、汪寿阳,2021c;穆来纳森、斯皮斯,2017),改进传统计量经济学方法以更好地帮助因果推断(Causal Inference)(阿西、因本斯,2019),发现稳健且具有可解释性的模式以更好地帮助理论构建(Theory Building)(蒂德尔、艾森哈特,2020;乔杜里等,2021;施雷斯塔等,机器学习如何赋能管理学研究?*——国内外前沿综述和未来展望刘景江郑畅然洪永淼*本项研究得到国家自然科学基金基础科学中心项目“计量建模与经济政策研究”(基金号:71988101)、国家自然科学基金项目“绩效反馈、制度逻辑与科技企业创业成长研究”(基金号:71872164)和国家自然科学基金项目“患者偏差行为的形成机制与医患关系管理策略研究”(基金号:72074189)的资助。感谢匿名审稿专家提出的宝贵修改意见。洪永淼为本文通讯作者。-191-DOI:10.19744/j.cnki.11-1235/f.2023.01062021)等。因此,它可以弥补管理学研究所存在的短板:第一,管理学研究传统上未能从海量、复杂、高维、非结构化、多模态数据中提取有用信息(洪永淼等,2023;洪永淼、汪寿阳,2021a),也未能克服社会经济系统的非实验性、不可逆性和时变性,以及社会经济数据的种种缺陷(洪永淼,2007)。第二,传统上,管理学定性研究常常采用少数甚至单个案例分析来构建理论,而没有使用大样本数据(施雷斯塔等,2021)。受制于有限样本和人工经验,这些研究很难从数据中识别新颖、稳健、具有预测性和相对可解释性的模式(蒂德尔、艾森哈特,2020;乔杜里等,2021)。并且,这些研究所构建的理论具有较弱的泛化能力。第三,基于观测数据(Observational Da⁃ta)的管理学定量研究通常采用传统计量经济学方法,而这一方法存在诸多明显的局限性:(1)它基于模型驱动思想,通常事先假定一系列苛刻的假设条件和一个小的线性低维参数模型(洪永淼、汪寿阳,2021c),无法捕获高维动态大数据中呈现的时变性、非线性和非平稳性特征(洪永淼、汪寿阳,2023;汪寿阳等,2019),并存在模型误设偏差(洪永淼、汪寿阳,2021c)。(2)它以统计显著性和样本内拟合优度为模型优劣主要评估标准,模型的样本外预测能力较弱,泛化能力较差(陈强,2021;蒂芬,2019;洪永淼,2021)。(3)它只能刻画主要因素的影响,无法对一因多果、同因异果、一果多因、同果异因、多因多果和复合因果且有滞后性的事件做出可靠的因果推断(陈等,2023;洪永淼,2007)。已有许多国外文献采用机器学习方法,研究资产定价(冯等,2020;顾等,2020;卡洛米里斯、马梅斯基,2019;马内拉、莫雷拉,2017)、并购与公司治理(马尔霍特拉等,2018;乔杜里等,2019;游,2018)、公司业绩(蒂德尔、艾森哈特,2020)、知识产权(乔杜里等,2020)、公司雇佣(栾等,2019)、审计(谢等,2020)、非对称和私人信息(刘等,2020)等热点主题。国内的管理学研究逐渐开始重视运用机器学习方法。例如,国内期刊《管理世界》发表的多篇论文运用机器学习方法研究了信息和市场效率(宫晓莉等,2020;马黎珺等,2019;沈艳、王靖一,2021;张宗新、吴钊颖,2021)、企业融资与治理(黄益平、邱晗,2021;沈艺峰等,2017)、企业行为(胡楠等,2021)等主题。然而,机器学习在我国管理学研究中的应用仍处于初级阶段。特别是,我国顶级管理学期刊在工商管理研究领域和会计财务研究领域②的实证文献极少运用机器学习进行因果推断和理论构建。造成这一现象的原因可能是,在中国管理学研究领域目前很少有文献系统梳理机器学习方法给传统管理学研究范式与方法带来的挑战。极少有文献对实质性使用机器学习方法研究管理问题的最新成果进行系统综述并由此提出未来研究机会。虽然已有少数国内文献梳理了机器学习对经济学研究的影响(黄乃静、于明哲,2018;蒋锋、张文雅,2022;王芳等,2020),但是缺乏从变量测量、事件预测(包括事件分类)、因果推断和理论构建等4个方面系统而具体地阐述采用机器学习方法赋能经济学研究的途径和策略。中国具有独特的政治、经济、文化和社会制度,其中蕴含的中国故事具有明显异于西方世界的特性(王永贵等,2021)。尽管许多学者强调了这些中国情境的独特性,因所采用的研究范式和研究方法还不够完善,特别是缺少既符合科学研究范式又适合于中国情景的实证研究方法的创新与应用(柴国俊、孙若宸,2022),目前中国管理学的学术影响力较弱(洪永淼、汪寿阳,2020,2021b;王永贵等,2021)。显然,这些不利于提升中国管理学在国际学术界的“话语权”(贾良定等,2015;王永贵等,2021),也不利于更好地为世界管理学贡献中国智慧(王永贵等,2021)。简而言之,方法与思想同等重要(洪永淼、汪寿阳,2020)。因此,这进一步说明,很有必要综述国内外顶级期刊发表的运用机器学习方法赋能管理学研究的前沿文献,并据此评估现有学术进展和发现未来研究机会。本研究具有3个主要贡献。第一,以国际上得到广泛认可的UTD-24期刊③和“2021中国最具国际影响力学术期刊(人文社会科学)”前20名中的管理学期刊④于1999~2021年正式发表的文献为数据,采用编码方法,识别了工商管理和会计财务两大研究领域的国内外学者应用机器学习进行管理学实证研究的4种核心途径:变量测量、事件预测、因果推断和理论构建。第二,从研究主题、研究问题、数据集、机器学习算法和研究结论等多个方面系统总结了这些途径的代表性文献,从而描绘了一幅机器学习赋能管理学研究的图景。第三,在分析以往研究方法不足的基础上,深入阐述了一系列采用机器学习开展管理学研究的主要策略和未来机会。我们特别强调,未来研究应更加关注机器学习在因果推断和理论构建这两大方面的重要作用。总之,本研究机器学习如何赋能管理学研究?理论述评-192-《管理世界》2023年第9期将有助于我国学者采用合适的最新机器学习技术、方法与工具,聚焦于中国情境、中国问题和中国数据,变革中国管理学研究范式,创新中国管理学研究方法,讲好中国管理故事,构建具有国际影响力的中国特色管理理论(黄群慧,2018;贾良定等,2015;李宝元等,2017;王永贵等,2021)。二、机器学习发展概况(一)机器学习定义和本质塞缪尔(1959)最早将机器学习定义为,“在没有被显性编程的情况下,使计算机具有学习能力的研究领域”(杰隆,2019)。但该定义过于宽泛且仅为定性描述,因此米切尔(1997)通过引入3个概念:经验、任务和性能,给出了更加具体且严谨的定义,“机器学习是一个计算机程序。如果该计算机程序在任务上的性能随着经验提高,则称它从与某些任务和性能指标有关的经验中学习”(杰隆,2019)。本质上,机器学习是“ 一个数学优化问题与实现该优化问题的计算机算法问题”(洪永淼、汪寿阳,2021a)。它使计算机具备从大量数据中学习的能力(陈强,2021;洪永淼、汪寿阳,2020,2021a)。机器学习是“从训练数据中寻找一个优化算法,使预测测试数据的损失函数加上惩罚项最小化,以达到最优样本外预测效果”(洪永淼、汪寿阳,2021a)。面对实时发生、数量和体量大、类型多和信息密度低的大数据,非常适合运用机器学习方法对复杂高维大数据进行降维,实现更加精准的预测(洪永淼,2021;洪永淼、汪寿阳,2021b),更好地帮助识别因果关系和构建新的理论,从而变革管理学研究范式,创新管理学研究方法。(二)机器学习发展简史根据不同时期的研究内容和目标,本文将机器学习的发展历程划分为5 个阶段(周志华,2016)。第一阶段是20世纪50年代初到60年代中叶奠定基础的热烈时期,主要研究“没有知识”的学习,代表性研究是1952年塞缪尔设计的跳棋程序,罗森布拉特(1958)基于神经网络“连接主义”(Connectionism)提出的感知机(Per⁃ceptron)。第二阶段是20世纪60年代中叶到70年代中叶停滞不前的冷静时期,主要研究将各个领域的知识植入到学习系统里,出现了基于逻辑表示的“符号主义”(Symbolism)学习技术,如亨特等(1966)提出的“概念学习系统”。第三阶段是20世纪70年代中叶到80年代中叶重拾希望的复兴时期,主要聚焦于从学习单个概念扩展到学习多个概念,探索不同的学习策略和学习方法。第四阶段是20世纪80年代中叶到21世纪初现代机器学习的成型时期。此时,机器学习已成为一门独立的学科(卡博内尔,1990)。20世纪80年代中期,布莱曼等(1984)提出的CART 算法(Classification and Regres⁃sion Trees)和昆兰(1986)开发的ID3 算法(Iterative Dichotomiser 3)使得以决策树(Decision Tree)为代表的“符号主义学习”占据主流。同年,鲁梅尔哈特等(1986)提出的反向传播算法推动了神经网络“连接主义学习”发展的第二次高潮。20 世纪90 年代中期,科尔特斯和瓦普尼克(1995)提出的支持向量机(Support Vector Ma⁃chine,SVM),作为“统计学习”(Statistical Learning)的代表大放异彩。与此同时,“集成学习”(Ensemble Learn⁃ing)也成为机器学习的重要延伸,最著名的是提升法(Boosting)(弗罗因德、夏皮尔,1996,1997;夏皮尔,1990)、装袋法(布莱曼,1996)和随机森林(Random Forest)(布莱曼,2001a)等算法。第五阶段是21世纪初至今大放光芒的蓬勃发展时期。欣顿和萨拉胡季诺夫(2006)掀起了以“深度学习”(Deep Learning)为名的热潮,代表性算法有深度信念网络(欣顿等,2006)和生成对抗网络(古德费洛等,2014)等。可以预见的是,在未来,强化学习、对偶学习、迁移学习、分布式学习以及元学习等多种技术将成为机器学习重要的前沿方向(普拉莫德等,2021),不同流派也会通力合作,将各自的方法与人类知识相结合(乔丹、米切尔,2015),进入“人机协同”时代,从而更好地帮助人们解决实际应用中的复杂问题。(三)机器学习应用场景机器学习拥有强大的数据处理能力、数据挖掘能力和信息洞察能力,能够有效提高生产力和工作效率,增强企业核心竞争力,目前已经被广泛应用于各行各业(贝尔,2020;杜尔哈尔等,2020;普拉莫德等,2021)。在医疗健康领域,将机器学习技术与大数据相结合,借助可穿戴设备和传感器传输患者的体重、心率、脉搏、血压-193-和血糖水平等数据,实时监测和评估患者健康状况,有利于医生根据历史信息分析患者病情,制定个性化治疗方案。在金融服务领域,一是利用机器学习技术建立财务欺诈预测模型,有效识别高风险客户和财务欺诈行为,实现风险预警和反欺诈;二是利用机器学习技术建立信用评分模型,准确客观地评估中小微企业和个人信贷风险,提升普惠金融服务精准度;三是利用机器学习技术进行算法交易,确定最佳交易时间和投资机会,辅助和改善投资决策。在市场营销领域,零售商广泛运用机器学习技术分析历史销售数据,帮助制定营销活动、客户商品规划和价格优化策略,还结合自然语言处理和自然语言理解技术,配备虚拟助手和聊天机器人,为顾客提供定制化和个性化购物体验。在交通运输领域,一方面运用监督学习、非监督学习和强化学习等方法,以大数据为原料实现自动驾驶智能感知和智能决策;另一方面综合利用云计算、人工智能、机器学习和物联网等技术,搭建数据处理中心和资源整合平台,建立高效、便捷、安全、经济的城市智能交通运输体系,以数字力量驱动智慧城市构建。三、研究设计与方法(一)数据收集本文使用标准抽样方法(巴顿,1990)确定文献范围,研究国内外管理学顶级期刊发表的、实质性使用机器学习方法的文章。首先,本文选取UTD-24 期刊,以“machine learning”、“decision tree”、“support vector ma⁃chine”、“random forest”、“artificial neural network”和“deep learning”等为关键词,对目标期刊的所有在库文章进行全篇检索,把正式发表时间限定到2021年12月末,得到一张包含1258篇文献的初步文献清单。其中,会计领域52篇,财务领域72篇,信息系统领域322篇,营销领域208篇,管理科学领域522篇,工商管理领域82篇。考虑到篇幅有限和用途梳理的全面性,本文只关注工商管理和会计财务两大研究领域⑤。因最早实质性运用机器学习方法的文章发表于1999年,本文聚焦于这两大领域中正式发表于1999~2021年且实质性使用机器学习方法进行实证研究的文章。我们逐一阅读这两大领域中的206篇文章,剔除没有实际使用机器学习方法进行数据分析的文章,也剔除评论、书评和会议征稿等论文,最终筛选出符合条件的62篇文章。其中,工商管理领域18篇,会计财务领域44篇。如图1所示,从这些国际管理学期刊的文章来看,机器学习方法被实质性使用的频率呈现逐年上升的趋势⑥。特别是,2018年开始出现了快速增长的态势。接着,类似地,本文选取“2021中国最具国际影响力学术期刊(人文社会科学)”前20名中的管理学期刊,以“机器学习”、“决策树”、“支持向量机”、“随机森林”、“人工神经网络”和“深度学习”等为关键词对上述中文期刊的文章进行全文检索,以“machine learning”、“decision tree”、“support vector machine”、“random forest”、“artificial neural network”和“deep learning”等为关键词对上述英文期刊的文章进行全文检索,同样限定正式发表时间为2021 年12 月末,得到一张包含153 篇文献的清单。其中,工商管理领域54 篇,会计财务领域52 篇,其他领域47篇。因国内最早实质性使用机器学习方法的文章发表于2004年,本研究聚焦于工商管理和会计财务两大领域中正式发表于2004~2021年且运用机器学习方法进行实证研究的文章。我们逐一阅读这两大领域中的106 篇文章,最终筛选出符合条件的43 篇文章。其中,工商管理15篇,会计财务28篇。图2显示了这些国内管理学期刊历年发表实质性使用机器学习方法进行实证研究的文章的数量⑦。(二)数据编码与文献分析在确定研究目标后,我们按照以下3个步骤对数据进行编码和文献分析。第一步,根据以往理论和实证研究(阿西、因本斯,2019;蒂德尔、艾森哈特,2020;格里默等,2021;洪永淼,2021;洪永淼、汪寿阳,2021a,2021b;黄乃静、于明哲,2018;图1 两大研究领域国际顶级管理学期刊上实质性运用机器学习方法的文章发表趋势发表数量发表年份机器学习如何赋能管理学研究?理论述评-194-《管理世界》2023年第9期乔杜里等,2020;施雷斯塔等,2021),我们总结出机器学习方法在管理学实证研究中的4种核心用途:变量测量、事件预测、因果推断和理论构建,如图3所示。变量测量是根据一种规则,用数量的方法描述研究对象所具备的某种特征或行为,其目标是对变量之间的关系进行量化推断(陈晓萍等,2008)。事件预测是使用已掌握的经验或知识,预先推知和判断事物未来发展状况(阿西,2019),其目标是预料来自不同观测总体的样本已经或将要在未来实现的结果(格里默等,2021)。因果推断是借助理论和对制度细节的深入了解,估计事件和选择对给定结果的影响(坎宁安,2021),其目标是比较在同一干预措施下不同反事实(Counterfactual)结果之间的差异(格里默等,2021)。理论构建是构建概念及其相互关系,以展示一种现象是如何和为什么发生的过程(焦亚、皮特雷,1990;科利、焦亚,2011;克里斯蒂安森、钱丹,2017),其目标是建立稳健且具有可解释性的理论。变量测量、事件预测、因果推断和理论构建是管理学实证研究的4项关键任务。它们既相互区别又紧密关联。理论构建在管理学实证研究中占据着核心地位(班伯格,2018)。管理学顶级期刊格外强调文章的理论贡献(科利、焦亚,2011)。实证研究的核心目标是理论构建。衡量一个“好”的实证研究的首要标准是它能够建立稳健且具有可解释性的理论。因果推断是理论构建的先决条件。事件预测是因果推断的必要前提。变量测量是开展管理学实证研究的根基。总之,这4个途径相辅相成,构成目的与手段的关系,前1个途径是后面1个、2个或3个途径的基础。机器学习具有一系列独特优势,如自动学习数据节省研究时间(乔杜里等,2019),改进传统的计量经济学方法(阿西、因本斯,2019),从复杂高维的数据环境中提取有意义的信息(洪永淼、汪寿阳,2021a,2021b),运用灵活的函数形式构建精准度更高的模型(洪永淼、汪寿阳,2021a,2021b,2021c;穆来纳森、斯皮斯,2017),使用正则化和交叉验证方法提高模型的泛化能力(蒂德尔、艾森哈特,2020;蒂芬,2019;乔杜里等,2021;瓦里安,2014)等。因此,它特别适用于更好地进行变量测量、事件预测、因果推断和理论构建。具体地,采用机器学习从复杂高维数据环境中提取有用信息进行变量测量,可以看作是给机器学习系统布置任务以预测分配标签。从这个角度来看,变量测量问题被机器学习转化成为事件预测问题(格里默等,2021)。虽然预测和因果推断有着很大的不同,但是因果推断的本质是比较同一组样本的不同反事实,估计反事实的实质是预测(洪永淼、汪寿阳,2021a)。机器学习的精准预测能力可以对不可能真实发生的反事实进行合理估计,从而助力因果关系的识别(郭峰、陶旭辉,2023;瓦里安,2014)。理论构建的核心是发现模式和理论解释(施雷斯塔等,2021)。虽然机器学习自身不能提供理论解释(施雷斯塔等,2021),但是它可以采用其强大的算法,依靠多次迭代比较来寻找出最优预测模型(蒂德尔、艾森哈特,2020),从大数据中挖掘稳健模式,从而助力理论构建(施雷斯塔等,2021)。第二步,本文根据美国经济学会《经济文献杂志》(JEL)所创立的主题分类系统对文献进行编码。若文章包含分类号,则根据已经标记好的分类号进行编码;若不图3 机器学习方法在管理学研究中的4种用途图2 两大研究领域国内顶级管理学期刊上实质性运用机器学习方法的文章发表趋势发表数量发表年份-195-包含分类号,则仔细阅读文章的摘要、引言和正文,根据文献主要探讨的主题,人工选择一个最适合的分类号。为了保证编码的客观性,本研究编码人员针对编码不一致的情况及时讨论、力求统一。若仍存在难以形成统一意见的文章,则向相关领域的专家寻求建议,最大程度避免由单一编码者的主观臆断对结果产生的偏差。第三步,我们精心阅读变量测量、事件预测、因果推断和理论构建等4 种核心途径的代表性文献,细致梳理这些文献的研究主题、研究问题、数据集、机器学习算法和研究结论;深入系统地分析以往研究方法的优势与不足,进而从上述4种途径阐述运用机器学习赋能管理学研究的策略和未来机会。四、机器学习在管理学研究中的应用综述工商管理和会计财务作为管理学的两大核心研究领域,包含大量来自个人、企业和政府的文本、图像、音频、视频等极具信息价值的非结构化数据。传统方法无法对这些非结构化数据进行量化分析,只能进行定性分析。借助机器学习方法,学者们可以从这些非结构化数据中挖掘、提取和构建诸如高管人格特质、管理者自恋、公司文化、媒体文章语调和投资者情绪等有意义的变量(洪永淼、汪寿阳,2021a,2021b),运用灵活的函数形式和降维技术来实现更精准的预测(洪永淼、汪寿阳,2021b,2021c),利用正则化和交叉验证方法提高模型泛化能力以帮助因果推断和理论构建(蒂德尔、艾森哈特,2020;蒂芬,2019;乔杜里等,2021;瓦里安,2014),从而更好地开展这两大领域中关键问题的实证研究。因此,本部分以这两大研究领域为例,以机器学习赋能管理学研究的4种核心用途为主线,全面回顾和系统梳理UTD-24期刊和国内顶级管理学期刊于1999~2021年正式发表的文章。具体来说,本文遵循重点性原则和典型性原则,按照这些领域和用途,总结归纳了代表性文献的研究主题、研究问题、数据集、机器学习算法和研究结论⑧。(一)工商管理1. 变量测量现实生活存在海量非结构化数据。工商管理研究领域的学者采用多种机器学习方法,可以从这些非结构化数据中挖掘具有管理意义的信息来进行变量测量,进而开展相关研究。代表性文献如表1所示。以往研究从非结构化数据中,挖掘与CEO人格特质相关的信息,测量CEO的人格,进而估计不同人格特质对并购与公司治理决策的影响。例如,马尔霍特拉等(2018)运用SVM 对2002~2012 年Execucomp 数据库中S&P 1500公司的2381名CEO的口语文本(CEO与财务分析师季度财报电话会议中问答环节所说的文字)进行人格评分,测量CEO的外倾性。研究发现,具有外倾性的CEO更有可能参与并购。乔杜里等(2019)通过对哈佛商学院“创造新兴市场”项目中的CEO 进行访谈,结合无监督学习中的隐含狄利克雷分布(Latent DirichletAllocation,LDA)和情感分析,对CEO的口头沟通文本进行内容和价值提取。同时,应用监督机器学习中的卷积神经网络(Convolutional Neural Networks,CNN),对CEO 访谈视频中的面部表情进行编码和情绪识别,构建出5种不同沟通风格(兴奋、严厉、戏剧性、漫不经心和忧郁)的测量,进而得到在表达方式上戏剧化的CEO不太可能监督重大收购的结论。在企业行为研究中,哈里森等(2019)采用1996~2014年S&P 1500公司的3573名CEO的财报电话会议记录,表1 工商管理研究领域采用机器学习进行变量测量的代表性文献研究主题并购与公司治理(G34)*企业行为(D21)作者(年份)马尔霍特拉等(2018)乔杜里等(2019)哈里森等(2019)胡楠等(2021)研究问题CEO的外倾性如何影响公司并购行为?如何测量CEO 的沟通风格?CEO沟通风格如何影响收购?CEO的五大人格特质如何影响公司战略变革?管理者短视主义如何影响企业长期投资?数据集2002~2012 年Execucomp 数据库中S&P 1500公司CEO的口语文本2012~2018年哈佛商学院“创造新兴市场”项目中CEO 的访谈文本和视频1996~2014 年S&P 1500 公司CEO 的口语文本2007~2018 年A 股公司年度财务报告的MD&A部分机器学习算法·SVM·LDA·CNN·GBM·Word2Vec主要结论外倾性CEO 更有可能参与并购,更频繁地开展并购,并进行更大规模的并购。CEO 有5 种沟通风格;在表达方式上戏剧化的CEO不太可能监督重大收购。开放性和宜人性的CEO 对战略变革有直接影响,另外3种人格特质没有直接影响。管理者短视导致企业减少资本支出和研发支出。注:*G34为JEL主题代码,下同。机器学习如何赋能管理学研究?理论述评-196-《管理世界》2023年第9期运用梯度提升机(Gradient Boosting Machine,GBM)算法,开发一个开放式语言工具(Open-Language Tool)来测量CEO的五大人格特质。结果发现,开放性的CEO对战略变革有正向直接影响,宜人性的CEO对战略变革有负向直接影响,其他3种没有直接影响。胡楠等(2021)选取沪深两市2007~2018年所有A股公司年度财务报告为初始研究样本,提取其中管理讨论和分析部分(Management Discussion and Analysis,MD&A),利用文本分析、Word2Vec机器学习算法和词典法构建管理者短视主义指标,得出管理者短视主义特质会导致企业减少资本支出和研发支出的结论。2. 事件预测机器学习可以更有效地探索变量之间的相关性,进而对事件做出较为精准的预测。在工商管理研究领域,运用机器学习技术进行预测的文章主要聚焦于技术变迁和企业管理等主题。代表性文献如表2所示。学者们在知识产权管理研究中采用机器学习方法预测专利申请人策略性地省略相关信息或增加无关信息的行为。例如,乔杜里等(2020)将机器学习算法应用于美国专利商标局对专利的审查程序。他们发现,当代理人为了从有偏的预测结果中获益而战略性地改变算法输入时(即存在输入不完全性),机器学习技术得出了比布尔技术(Boolean Technology)更差的预测结果。他们进一步发现,当将特定领域专业知识和特定年份技能这两个关键人力资本属性完全纳入用于生成预测的训练数据集和算法中时,运用机器学习技术进行预测的精准度得到显著提升。因此,这些研究结果表明,只有将机器学习和人力资本相结合,才能够更好地减轻机器学习的预测偏差,有效地提升专利审查效率。也有学者在公司雇佣决策研究中采用机器学习方法预测求职者的未来表现。比如,栾等(2019)选用航空公司236 名求职者数据,分别运用套索(Least Absolute Shrinkage and Selection Operator,LASSO)、随机森林和SVM三种流行的机器学习算法预测求职者的未来表现,并与启发式推断策略和逻辑回归的预测精准度进行比较。结果发现,当样本量较大时,LASSO和随机森林算法的预测表现与逻辑回归相似,但稍微落后于启发式策略,SVM的表现落后于上述两种算法。当样本量较小时,LASSO和随机森林算法比逻辑回归更差,远落后于启发式策略。虽然SVM的预测精准度优于其他两种算法,但仍未能超越启发式策略。还有学者在电子商务研究中运用机器学习方法对顾客在线评论和企业管理反馈策略进行分类。比如,郭晓姝等(2021)利用SVM机器学习方法,对国内某旅行网站99027名顾客二次入住酒店后发表的在线评论,进行积极、偏积极、偏消极和消极的评论情绪分类,并根据酒店的两次回复内容对道歉承诺类管理反馈策略和非表2 工商管理研究领域采用机器学习进行事件预测和理论构建的代表性文献用途事件预测理论构建研究主题知识产权(O34)公司雇佣(M51)电子商务(L81)公司业绩(L25)争议解决(J52)模型构建与估计(C51)作者(年份)乔杜里等(2020)栾等(2019)郭晓姝等(2021)蒂德尔和艾森哈特(2020)何等(2020)施雷斯塔等(2021)研究问题存在输入不完全性偏差时,人力资本如何补充机器学习算法以提高机器学习的预测精准度?生态理性视角下,启发式策略在管理决策中的表现会怎样?在消费者情绪多样性的情况下,道歉承诺对顾客二次满意度有怎样影响?什么是收益模式的最优选择?如何有效解决社区治理纠纷?如何利用机器学习技术从数据中构建理论?数据集美国专利商标局专利数据航空公司236 名求职者数据国内某旅行网站99027名顾客二次入住酒店数据2015 年11 月苹果公司App Store 上的移动产品数据GitHub 中包含“ 许可”问题的项目数据模拟数据集机器学习算法·机器学习算法·LASSO·随机森林·SVM·SVM·惩罚性多分类逻辑回归·决策树·随机森林·LASSO·装袋法·ANN·RR·随机森林·LASSO·GBRT·神经网络·RR主要结论存在输入不完全性偏差时,机器学习的预测效果较差;两种关键人力资本可以在输入不完全的情况下对机器学习算法进行补充,以提高机器学习预测精准度。在管理决策常见的条件下,启发式策略比复杂的理性策略在预测效果上表现更好。道歉承诺类管理反馈策略对提高顾客二次满意度有积极作用;顾客的矛盾情绪和负面情绪对顾客二次满意度有负向影响;在顾客消极情绪下,道歉承诺能够进一步提升满意度。成功的商业模式需要价值获取与价值创造相契合。当社区中的治理纠纷带有群体问题解决过程而非多方讨价还价过程的特征时,更有可能被解决;群体过程和群体属性是解决社区治理纠纷的两个必要条件。在组织管理领域中,可以利用机器学习算法从大规模数据中归纳出具有稳健性和可解释性的模式,从而帮助理论构建。-197-道歉承诺类管理反馈策略进行分类。研究发现,适当的道歉承诺管理反馈策略能够提高顾客的二次满意度,但需要根据顾客的不同情绪,采取相应的反馈策略,才能进一步提升满意度。3. 理论构建理论构建是机器学习技术的一个最新用途。虽然机器学习自身不能构建理论,但是它能够帮助研究者增强理论构建的规模和精准度(蒂德尔、艾森哈特,2020;格里默等,2021;施雷斯塔等,2021)。一方面,机器学习能够在定量数据中寻找模式,使用算法系统地估计和比较多种替代模型,选择最具有预测性的稳健模型(阿西,2019)。另一方面,机器学习能够采用正则化和交叉验证等技术来限制过拟合和过度复杂模型,从而提高预测和泛化能力(蒂德尔、艾森哈特,2020;乔杜里等,2021;瓦里安,2014)。工商管理研究领域的学者日益运用机器学习赋能理论构建。代表性文章如表2所示。例如,蒂德尔和艾森哈特(2020)综合运用机器学习和多案例理论构建等方法,提出了一个高性能收益模式—活动系统配置的框架。具体地,他们对2015 年11 月苹果公司App Store 上的全部移动产品进行抽样,得到了66652个产品样本,随机从中选择了400个受欢迎的产品和400个不受欢迎的产品。为了确保训练和交叉验证的数据平衡,他们进一步收集并预留了100个受欢迎和100个不受欢迎的产品作为样本外的测试数据,得到了1000个产品作为机器学习的样本。3种互补的机器学习方法(惩罚性多分类逻辑回归、决策树和随机森林)帮助他们获得了稳健且相对可解释的结果,而不是以可解释性为代价所产生的具有最佳预测的复杂输出。通过整合探索性数据分析所得到的趋势和案例理论抽样的路线图、多案例理论构建所确定的理论概念和机制、机器学习在案例研究中采用更精准的效应大小、等值路径、非线性和配置所提供的大规模证实和扩展,他们得出成功商业模式的核心是价值获取与价值创造相结合的结论。何等(2020)采用机器学习构建了解决社区治理纠纷的理论。具体地,他们使用LASSO、装袋法和人工神经网络(Artificial Neural Network,ANN)3种机器学习算法与岭回归(Ridge Regression,RR),对183个GitHub项目中包含的数据进行正则化与特征选择,以获得更容易解释且稳健的模式,并通过反复分割数据,以获得样本外预测精准度更高的模型。机器学习帮助他们发现:在较大的讨论组和没有许可证项目(相比于有许可证的项目)中,社区治理纠纷更可能得到解决。进而,他们随机抽取61个案例进行编码,探寻特征变量之间的因果关系,以加强理论机制的解释。案例的文本分析帮助他们发现:群体过程和群体属性是解决社区治理纠纷的两个必要条件。基于这些发现,他们开发了一个整合群体过程和群体属性的理论模型,以解释与在线社区的核心治理原则有关纠纷的解决。施雷斯塔等(2021)提出了一套利用多种机器学习算法助力理论构建的程序。基于一个模拟数据集,他们综合使用随机森林、LASSO、梯度提升回归树(Gradient Boosting Regression Tree,GBRT)、神经网络和RR 等多种算法确定关键预测因子,识别出具有稳健性和可解释性的关联作为溯因理论构建的输入,有效助力了理论构建工作的开展。研究结果表明,在组织管理领域,机器学习可以作为从大规模数据中构建理论的工具。(二)会计财务1. 变量测量会计财务研究领域已有许多学者运用机器学习方法,将非结构化数据转变为定量数据,对变量进行测量。代表性文献如表3所示。从会计和公司治理等研究主题来看,学者们应用机器学习对媒体文章、财务报表、分析师报告和推特推文等非结构化文本中的变量进行测量。例如,朴素贝叶斯算法(Naive Bayesian Algorithm)常被用来测量媒体文章语调(游等,2018)、10-K 与10-Q 报表中MD&A 的语调(亨利、利昂,2016)、分析师报告中的情绪(黄等,2014)和个人推文总体意见(巴托夫等,2018)。LDA也被用来测量10-K报表中的主题(布朗等,2020;戴尔等,2017)。它达到与朴素贝叶斯方法异曲同工的效果。从政府政策和监管等研究主题来看,以往研究运用多种机器学习对非结构化文本中的变量进行测量。比如,劳里等(2020)单独使用LDA识别和测量美国证券交易委员会意见函中关注的主题及其相对重要性,综合机器学习如何赋能管理学研究?理论述评-198-《管理世界》2023年第9期运用LDA和KL散度(KL Divergence)识别美国证券交易委员会意见函的边际信息价值。此研究发现,企业在IPO之前会在招股说明书中增加对美国证券交易委员会关注主题的披露。2. 事件预测机器学习能够采用灵活的函数形式,在数量庞大且高度相关的数据中选择预测因子并实施降维处理(格里默等,2021;洪永淼、汪寿阳,2021a,2021b),同时使用正则化和交叉验证缓解过拟合风险和限制过度复杂模型(蒂德尔、艾森哈特,2020;施雷斯塔等,2021)。因而,它在事件预测上具有很大的优势。会计财务研究领域的学者日益运用机器学习开展事件预测。代表性文章如表4所示。研究主题会计(M41)并购与公司治理(G34)政府政策和监管(G38)作者(年份)亨利和利昂(2016)黄等(2014)巴托夫等(2018)布朗等(2020)戴尔等(2017)游等(2018)劳里等(2020)研究问题哪种方法最适合评估财务披露语调?分析师报告文本是否具有信息价值?个人推特推文能否帮助预测公司收益和股票回报?财务报表披露的主题在预测故意误报时是否具有渐进的信息量?10-K报表披露的变化趋势是怎样的?政府控制如何影响媒体的信息中介和公司治理作用?IPO 之前,美国证券交易委员会和公司如何沟通?数据集2004~2012 年8-K 报表、1995~2007 年10-K和10-Q报表1995~2008 年S&P 500 指数公司发布的分析师报告2009~2012 年Russell 3000 指数公司的推特推文1994~2012 年10-K 报表、会计和审计执行公告、财务重述报告和10-K/As报表1996~2013年10-K报表CSMAR 中2005~2014 年上海和深圳证券交易所的上市公司信息、2005~2014 年在外国证券交易所双重上市的中国公司信息和2004~2014 年中国八家商业报纸文章2005~2016 年美国证券交易委员会给952家公司IPO的意见函机器学习算法·朴素贝叶斯·朴素贝叶斯·朴素贝叶斯·LDA·LDA·朴素贝叶斯·LDA·KL散度主要结论在财务披露和资本市场的背景下,等权词频测量法产生了强大且可复制的结果。分析师报告文本对未来五年的收益增长有预测价值。个人推文的总体意见可以预测公司即将到来的季度收益和公告回报。主题测量标准比常用的财务报表和文本风格测量标准提供了显著的增量预测能力。10-K 信息披露的趋势是长度、模板、粘性和冗余度增加,具体性、可读性和硬信息减少。市场导向的媒体文章比国家控制的媒体文章更具批判性、更准确、更全面、更及时;市场导向的媒体文章对公司治理具有显著影响。公司会在美国证券交易委员会关注的确切主题上增加招股说明书披露。表3 会计财务研究领域采用机器学习进行变量测量的代表性文献表4 会计财务研究领域采用机器学习进行事件预测的代表性文献研究主题会计(M41)资产定价(G12)信息和市场效率(G14)企业融资与治理(G30)作者(年份)佩罗尔斯等(2017)鲍等(2020)马内拉和莫雷拉(2017)卡洛米里斯和马梅斯基(2019)顾等(2020)陈等(2019)黄益平和邱晗(2021)研究问题如何改进财务报表欺诈模型的预测能力?如何构建精准的欺诈预测模型?新闻隐含波动率能否解释股票市场风险溢价?新闻文章内容如何预 |
[返回] |