欢迎访问一起赢论文辅导网
本站动态
联系我们
 
 
 
 
 
 
 
 
 
 
 
QQ:3949358033
微信:paperwinner
工作时间:9:00-24:00
经济管理论文
当前位置:首页 > 经济管理论文
大数据决策中数据结构转变
来源:一起赢论文网     日期:2024-11-03     浏览数:222     【 字体:

 《管理世界》2023年第12期摘要:数字经济时代,管理决策过程中大数据技术与人类决策预期目标之间割裂现象的不断涌现,逐渐引起了业界和学界的广泛关注。本文构建了一个“数据结构—认知模式”匹配分析框架,并以杭州城市大脑“交通治堵”大数据决策场景为研究对象,来探讨大数据决策过程中人类认知推动数据结构转变的微观基础。研究发现:第一,大数据决策是一个缄默数据、休眠数据和活跃数据3 类数据结构共存、转变的演化过程。决策启动阶段的数据结构包括缄默数据、休眠数据和活跃数据;决策发展阶段主要是休眠数据和活跃数据;决策实现阶段仅存在活跃数据一种形态。第二,大数据决策过程中,从决策启动到决策实现存在独特的数据结构与认知模式关系链条。一方面,从决策启动到决策发展阶段,主要通过“认知表征→认知解构”的发展型认知模式来推动缄默数据向休眠数据转变。另一方面,从决策发展到决策实现阶段,主要通过“认知解构→认知重构”的应用型认知模式来推动休眠数据向活跃数据转变。本文关于3 类数据结构的划分和人类认知在数据结构转变过程中的作用分析,为解决大数据技术与人类决策预期目标之间的分歧提供了新的分析思路,也为利用大数据提升城市治理体系和治理能力现代化水平提供重要实践启示。关键词:大数据决策 数据结构 人类认知 交通治堵一、问题提出在新一代信息技术、新应用、新业态的大力推动下,数字经济和信息社会成为当今世界最显著的全局性变革(申卫星,2020)。 大数据作为新经济价值捕获的核心要素,已成为驱动经济高质量发展的中坚力量,全面重塑了社会经济全方位、宽领域、多层次发展的新范式。例如,城市大脑作为集成、贯通、资源化城市级数据的数字基础设施,衍生出“交通治堵”等大数据创新性应用场景,有力推动了城市社会治理的精细化和城市公共服务的高效化,得到了习近平总书记的高度评价。中共中央、国务院出台的《关于构建更加完善的要素市场化配置体制机制的意见》中,明确指出要“提升社会数据资源价值,培育数字经济新产业、新业态和新模式”。《中华人民共和国国民经济和社会发展第十四个五年规划和2035年远景目标纲要》也提出,“充分发挥海量数据和丰富应用场景优势,促进数字技术与实体经济深度融合,赋能传统产业转型升级,催生新产业新业态新模式,壮大经济发展新引擎。”在此背景下,基于大数据的决策逐渐成为管理实践决策的主流范式(徐宗本等,2014;陈国青等,2020)。然而,人类对于大数据决策的依赖不断加重,导致了大数据决策过程中大数据技术和人类决策预期目标日益割裂的现象。一方面,是大数据解决社会经济宏大问题的价值潜力持续被激发,强化了人类利用大数据决策解决复杂问题的依赖性。首先,是大数据决策的价值驱动效应。大数据中蕴含着巨大的隐藏信息,其带来的价值逐渐成为驱动社会经济高质量发展和效率提升的重要动力源。譬如,在我国超大特大规模城市交通拥堵* 本文得到研究阐释党的十九届五中全会精神国家社科基金重大项目(21ZDA 013)和国家自然科学基金重点项目(7209131472032008)的资助,是第七批国家万人计划青年拔尖人才项目的阶段性成果,获得第三届李占祥管理哲学青年论文奖。感谢匿名评审专家提出的宝贵修改意见。严璐璐为本文通讯作者。大数据决策中数据结构转变:基于杭州城市大脑“交通治堵”应用场景的案例分析*程 聪 严璐璐 曹烈冰- -165DOI:10.19744/j.cnki.11-1235/f.2023.0139问题日益突出的背景下,城市大脑通过数字化解构和重构城市全要素资源,将大数据创新性的应用于交通态势感知、拥堵点快速识别、车辆调度与路线优化等系统性交通场景中,取得了显著成效,彰显了大数据决策的巨大社会价值。其次,是大数据决策的价值放大效应。鉴于大数据决策在社会经济领域中所带来的社会效益,人类倾向于利用大数据来实施目标决策以获得最优结果,而相对弱化人类认知能动性(布林约尔弗森、麦克埃尔海兰,2016;韩水法,2019)。 长期来看,这种日益盛行的大数据技术依赖式问题解决机制,助长了人类不自觉地将大数据决策视为社会经济问题解决的“权威”方案,进而将大数据决策主导的社会经济活动视为理所当然的社会选择(陈龙,2020;孙伟平,2020)。另一方面,是大数据决策服务人类宗旨的日益偏离。首先是大数据“不完备性”引发的决策结果失真问题。囿于数字技术和人类认知等多重因素的制约,真实世界中仍有大量客观事物尚未被数字化表征(孙伟平,2020)。 然而,以任务为中心的大数据决策往往忽视具有超高缺失比例的隐性数据,仍以“全数据”的形态为人类社会经济问题解决提供决策支持,不仅造成了决策结果失真,还可能违背决策者的初衷(陈松蹊等,2022)。其次是大数据原位性导致的数据价值潜力受限。大数据原位性是指人们习惯于从大数据基本特征出发,将大数据的价值局限于服务特定社会活动场景中的问题解决(段伟文,2015)。 然而,当前人类发展过程中涌现出的社会经济问题呈现多层次、跨领域、巨系统等特点,大数据的巨大价值潜力发掘愈发依赖于不同场景、不同层次的数据间关联表达,以及这些关联分析后的新关联发现(洪亮、马费成,2022)。 以城市交通治堵为例,传统交通拥堵点识别往往依赖于浮动车等较为单一的数据源,难以满足交通态势感知等精细化分析的需求。杭州城市大脑通过贯通跨城区、跨行业、跨领域的数据资源,汇聚交通卡口数据、互联网路况数据、气象数据、出行网络预约数据等多源数据,提高“一屏观全城”、“一网管全城”的系统视野和管理,为快速纾解堵点创造条件。现有研究虽然对弥合大数据决策过程中大数据技术和人类决策预期目标之间的割裂进行了尝试(卢格迈尔等,2017;巴拉苏布拉马尼亚安等,2022;段虹、徐苗苗,2016),但尚未探讨人类认知在引导大数据决策及其场景转换中所发挥的作用。一方面,现有研究聚焦于大数据属性、特征的探讨。例如,大数据技术视角的研究认为,采样局限、传感器误差、噪声干扰和压缩精度等客观因素造成了大数据的不完备(王芳、郭雷,2022),应从数据容量、数据处理过程和分析技术等技术层面来解决大数据不完备所造成的决策问题和提高大数据价值发现和捕获(甘多米、海德尔,2015;扬森等,2017;布拉兹凯、多梅内克,2018;伊努布利等,2018)。 尽管存在多种手段来追求数据客观事实的完整表达,但大数据决策仍然依赖于人类对特定问题认知所构建的数据主观事实(段虹、徐苗苗,2016)。 另一方面,现有研究聚焦于强调社会伦理、道德、法律等对大数据决策过程的纠偏作用。例如,法律规制视角强调算法公开、算法解释权、知情选择权等规制措施(香橼、帕斯夸勒,2014;贡萨尔维斯,2017;丁晓东,2020;申卫星,2020)。 道德规范视角则关注“公共善”、“人类整体福利”等大数据决策实践过程中的道德准则(岳瑨,2016)。 但仅强调社会整体层面的约束效应,无法从根本上解决大数据决策偏离人类预期发展目标的核心问题。随着社会分工日益精细化和社会关系日趋复杂化,人类社会逐渐演化出了一套体系完善、功能完备的社会规范系统,构成了指导人类社会经济活动的行为准则,并保障了社会有序发展(庄平,1998)。 人类认知在全方位参与数据选择、质量控制等大数据决策全过程时,也同样需要遵循特定的社会规范系统(刘业政等,2020)。 因此,人类认知不仅能够提高复杂社会情境下的大数据感知、采集和应用水平,来实现数据客观事实的完备化目标,还能利用经验知识、直觉、洞察力等对具体社会场景中的大数据进行数据主观事实表达和建构。譬如,人类在掌握交通峰谷变换规律、辨识复杂交通网络态势等方面积累了丰富的经验知识,为解析交通拥堵成因提供了扎实的认知基础,从而为城市大脑“交通治堵”应用场景中数据汇聚和分析提供更为合理的指向。更重要的是,由于人类认知根植于社会规范系统的思想体系,因此,具有全过程参与引导大数据决策结果符合人类预期目标的潜力,而不仅仅是对大数据事前或事中等阶段性决策的监管强化。鉴于此,本文将研究问题聚焦于大数据决策中数据客观事实和数据主观事实的数据呈现方式是什么?大数据决策中数据结构转变:基于杭州城市大脑“交通治堵”应用场景的案例分析公共管理- -166《管理世界》2023年第12期它们是如何实现转变的?人类认知在这种转变过程中又发挥了怎样的作用?杭州城市大脑“交通治堵”大数据决策应用,充分利用人类认知能动性,实现跨领域、跨行业、跨部门等专用数据“孤岛”的互通,不断突破应用场景的边界,重塑了交通治理的决策范式,为推进城市治理体系和治理能力现代化提供了宝贵的实践经验。本文选取杭州城市大脑“交通治堵”大数据应用场景作为案例分析对象,尝试对上述研究问题进行回答。二、文献回顾(一)大数据特征研究:类型学视角“大数据”作为一种概念和思潮由计算领域发端,之后逐渐延伸至社会科学领域。1998年,美国硅图公司首席科学家约翰·马沙首次使用“大数据”一词来描述传统数据难以比拟的规模特征——数据爆炸现象(迪博尔德,2012)。 2001年,麦塔集团分析师道格·莱尼率先提出大数据“3Vs”模型,即大数据具有海量(Volume)、高速(Velocity)和多源(Variety 3 个显著的特征,揭开了大数据“Vs”特征类型学演化的序幕(陈等,2012)。 在此基础上,麦肯锡全球研究院将大数据功能属性扩展至“4Vs”,将“大数据”定义为一种规模大到在获取、存储、管理、分析方面大大超出传统数据库软件处理能力范围的数据集,这种数据集具有海量的数据规模(Volume)、快速的数据流转(Velocity)、多样的数据类型(Variety )和价值密度低(Value)等特征(马尼卡等,2011)。 为了适应与日俱增的数据量和大数据应用创新走向纵深,学界和业界不断提出大数据的新特征以符合决策发展需求。例如,国际商业机器公司在面对数据流波动幅度大的问题时,提出准确性(Veracity)是大数据的重要特征,以应对客户对大数据决策可靠性的质疑(齐科普洛斯等,2012);微软公司为了实现大数据决策价值最大化,提出易变性(Variability)、准确性(Veracity)和可见性(Visibility3 个重要特征。吴等(2014)则整合了4Vs模型等特征,提出了HACE 定理,认为大数据决策始于异构(Heterogeneous)、自治(Autonomous )的多源海量数据,旨在寻求探索复杂的(Complex)和演化的(Evolving)数据关联的方法和途径。这种基于类型学视角的大数据研究虽较为清晰地勾勒出大数据发展脉络,但简化了大数据的复杂性和忽略了其功能的情境嵌入性,在一定程度上制约了大数据应用的可推广性及其在具体应用场景中的解释力。(二)大数据决策的研究流派随着大数据决策中数据不完备性、决策结果偏离人类目标等诸多问题的不断显现,既有研究主要从两个视角尝试来解决这一问题。一方面,是大数据技术发展视角。这一视角的主要观点是,大数据决策结果争议问题不仅受到数据容量的影响,还涉及数据处理过程和分析技术的局限性(扬森等,2017;布拉兹凯、多梅内克,2018)。 大数据价值发现、创造和捕获需要历经数据收集、数据清洗、数据整合、数据存储等多个处理过程(甘多米、海德尔,2015;布拉兹凯、多梅内克,2018)。 由于采样局限、传感器误差、噪声干扰和压缩精度等客观因素的限制,应用于决策中的大数据难免存在缺失和瑕疵(陈松蹊等,2022;王芳、郭雷,2022)。 因此,如何提高相关技术水平来克服大数据决策结果的争议成为了学者们关注的焦点之一。例如,有学者提出开源软件框架等可以降低大数据决策中数据的不完备性风险(扬森等,2017;伊努布利等,2018)。 此外,也有研究利用熵(Entropy)、互信息(Mutual information)等信息论中的重要概念,试图把握数据质量和促进大数据价值释放(波佩斯库等,2016;拉米雷斯- 加列戈等,2017)。 例如,熵作为分类的主动学习启发式和度量预测不确定性的最优方法,用来管理动态数据流中数据丢失而造成的信息损失(阿纳格诺斯托普洛斯、葛兰西,2013)。 拉米雷斯- 加列戈等(2017)则通过特征选择和特征提取等降维技术从一组可能无关、冗余和充斥着噪声的原始特征分离出具有高价值的特征,从而提高大数据决策精度。戴等(2023)从信息融合的角度对多模态数据融合过程进行深入研究,分析了冗余数据融合、噪声数据融合、一致性数据融合、矛盾性数据融合等,通过公式化最小模型精度熵来衡量最大模型精度的不确定性,和定义模型信念熵来衡量模型估计的不确定性与真实数据分析的不确定性之间的差异,从而消除分歧以提高数据的识别精度。另一方面,也有研究从法律规制、道德规范等伦理视角来尝试纠正偏离人类发展目标的大数据决策。其- -167中,法律规制视角主要关注大数据决策伦理防范的法律法规,如算法公开、算法解释权、知情选择权等大数据决策规制措施(香橼、帕斯夸勒,2014;贡萨尔维斯,2017;丁晓东,2020;申卫星,2020)。 而道德规范视角则关注“公共善”、“人类整体福利”等大数据决策实践过程中的道德准则(岳瑨,2016)。 这种强调对大数据算法程序公正、演算过程公开的约束,来矫正大数据决策偏离人类发展目标的方法,仍然无法逃脱大数据算法独断专行的问题解决思路。即强调社会整体层面对大数据决策过程的约束,仍然无法从根本上解决大数据决策偏离人类目标的技术“诅咒”。究其原因,首先,是大数据决策的全过程无法摒弃人类认知的参与(刘业政等,2020)。 人类认知不仅在数据感知、采集、结果解释等方面发挥着不可或缺的作用,其根植于社会规范系统的特性也为人类全过程引导大数据决策结果符合人类预期目标提供了可能。其次,是大数据决策结果的价值体现依赖于其所嵌入的独特社会场景(阿巴西等,2016)。 正如杨善林等(2022)指出,医疗健康事关人民生命健康安全,对经验和知识依赖性强,对服务的精准性要求高,单纯依靠数据获得的解决方案往往存在较高的风险,需要医疗健康领域知识的支撑。(三)大数据决策中的人类认知基础人类认知包含心理表征和心理活动两层含义,前者是指个体对客观世界的认知表征,后者则是指获取和处理信息所涉及的心理活动(科尔曼,2006)。 在此基础上,赫尔法特和彼得拉夫(2015)探讨了人类认知如何支持蒂斯(2007)提出的感知、捕获和重构3 类动态管理能力。第一,知觉和注意力两种人类认知在感知机会中发挥了重要作用。知觉是组织并解释客观世界中实体产生的感觉信息的加工过程(格里格、辛巴杜,2002)。 人类能够将来自客观世界的知觉信息与先验知识、期望和信念结合起来,对客观世界的实体做出合理的预测。注意力是对可得知觉信息的指向和集中(格里格、辛巴杜,2002)。 注意力对知觉至关重要,因为其决定了哪些刺激被识别(科斯林、罗森堡,2006)。 第二,问题解决和推理在捕获机会中起到关键作用。问题解决是按照一定的目标,通过一系列的心理活动使得问题得以解决的过程(格里格、辛巴杜,2002)。 问题解决可能是有意识的控制加工,也可能是自动的“启发式处理”。推理是指通过应用逻辑的形式规则或其他理性程序来找到问题解决方案的心理活动(科尔曼,2006)。 第三,沟通和社会认知是人类认知中重构机会的能力。沟通能够明晰总体目标来促进不同部分之间的交互。而社会认知提供了影响他人行为的潜力,从而促进不同行为体之间的协作。此外,扎德(1997)指出人类认知基础包括细粒度化、组织和因果关系。细粒度化是将问题整体分解为若干部分;组织是将若干部分整合成整体;而因果关系则是指原因和结果的联系。上述研究为本文探讨大数据决策中数据客观事实向数据主观事实转变过程奠定了理论基础。人类认知在决策过程中遵循斯坦诺维奇和韦斯特(2000)提出的双系统模型。一方面,是基于直觉的启发式系统(卡尼曼,2011),决策者基于对模式或结构的认知形成印象或直觉,促使其产生整体联想,并与外部环境刺激相匹配(戴恩、普拉特,2007)。 这一决策过程通常不需要高强度的认知努力,而是自动和无意识的。尽管其能做出快速反应,但也容易受到认知偏见的影响。另一方面,是基于理性的分析加工系统(卡尼曼,2011)。 决策者需要在处理复杂、新颖或对认知有挑战的任务时启动该系统,并将注意力分配给需要复杂计算、逻辑推理、主观选择等心理活动(戴恩、普拉特,2007)。 认知双系统模型通常是相互补充的,共同塑造人类决策选择和行为,进而产生更为全面和平衡的决策。然而,认知双系统之间也存在竞争关系(赫尔法特、彼得拉夫,2015)。 具体地,当启发式系统占主导时,认知偏见容易促使人类做出非理性甚至错误的决策。而在分析加工系统占主导时,人类需要基于更多的认知资源做出事实逻辑研判,这可能由于过度依赖事实证据而导致“分析瘫痪”,错失了决策的最佳时机(郑晓龙等,2023)。在数字技术持续迭代升级的背景下,超大规模的数据量远远超出了人类认知双系统处理的能力范围。因而,人类愈发依赖基于纯粹的大数据所做出的决策,而不断弱化人类认知的主动性,暴露出了当前大数据决策民主化匮乏、决策价值内核失真等问题(廖备水,2022)。 鉴于此,探讨人类认知模式对于大数据决策情境下数据结构的表征、解构和重构,能够弥补纯粹依靠海量大数据决策的不足。因此,本文将深入讨论人类认知模式如何影响数据结构转变,进而探讨人类认知模式与数据结构转变对大数据决策的影响过程。大数据决策中数据结构转变:基于杭州城市大脑“交通治堵”应用场景的案例分析公共管理- -168《管理世界》2023年第12期(四)理论述评与研究缺口当今世界,大数据决策已然成为了社会经济各领域问题解决的主流手段之一。但随之而来的大数据决策结果偏离人类发展目标的问题也引起了学者们的广泛关注(巴拉苏布拉马尼亚安等,2022)。 已有研究虽然为此展开了大量探讨,但仍然存在以下两方面的不足。一方面,现有研究聚焦于追求数据客观事实的完整表达,而相对忽略了人类对特定问题认知所建构的数据主观事实。尽管数字技术的飞速进步促进了数据客观事实表达的精细化与准确性水平,但社会经济问题解决并不完全取决于简单的海量数据的挖掘与堆砌,反而更加依赖人类认知、加工所构建的数据主观事实(段虹、徐苗苗,2016)。 正如王天恩(2022)指出,人类对于信息的处理过程本质上是一个从数据客观性到数据主观性转变的过程。即人类不是被动接收信息,而是对信息进行加工、改造的主观感受过程。大数据决策中数据客观事实和数据主观事实可以通过“n=all”和“n=me”两种机制来解释。“n=all”是指人类通过数字技术来表征和反映客观世界,形成高解析度、微粒化的数据客观事实(巴斯克维尔等,2020;刘培,2019)。 因此,数据客观事实不会因人类认知改变而改变。相反,“n=me”则是指围绕具体问题解决所构建的情境化数据(艾斯特林,2014)。 这些情境化数据源于人类对具体问题所嵌入场景的理解,进而建构数据主观事实作为大数据决策的社会性依据。因此,由追求数据客观事实的完整表达转向建构更有社会意义的数据主观事实,为大数据决策结果偏离人类发展目标问题的解决提供了一个崭新的视角。另一方面,现有研究强调道德、法律等社会整体层面对大数据决策极化现象的纠偏作用,但仍然无法解决大数据算法独断专行这一根本性问题。究其原因,主要是在数据客观事实向数据主观事实转向过程中,忽略了人类认知在引导大数据决策及其场景转换过程中所发挥的作用。具体而言,人类认知全方位参与和指导大数据感知、采集和应用过程遵循着人类社会规范系统,这为人类利用已有的经验知识、直觉、洞察力等认知模式对具体社会场景中的大数据进行数据主观事实建构和表达奠定了基础,也为人类认知全过程引导大数据决策结果符合人类预期目标提供了可能。鉴于此,本文将人类认知纳入分析框架,探讨大数据决策中数据结构转变及人类认知在这种数据结构转变过程中的作用。三、大数据决策中数据结构类型甄别(一)数据结构甄别原则如何对大数据类型进行可靠甄别是人类掌控数据质量的重要挑战之一,能够为大数据价值释放和大数据决策提供重要支持(波佩斯库等,2016)。 现有研究从信息论视角出发,利用熵、互信息等重要概念,试图依据数据功能来区分大数据中的数据类型,并分析其可能拥有的潜在价值(波佩斯库等,2016;拉米雷斯- 加列戈等,2017)。 信息熵、互信息等信息论中的重要概念虽然能够反映数据的不同形态,但主要是将大数据的数据类型特征数学化、公式化、模型化,更强调大数据的客观数据事实,而忽略了大数据在解决实际问题中的情境嵌入性和数据主观事实建构诉求。因此,本文借鉴有关知识激活框架(希金斯,1996)和信息质量研究(博塞、罗戈瓦,2019)中广泛探讨的两个核心构念:可得性和可及性,来进一步对大数据决策中的数据结构进行甄别。从知识激活框架来看,可得性是指特定知识是否实际存储于记忆中(塔尔文、珍珠斯通,1966)。 可及性则是指知识的激活潜力(塔尔文、珍珠斯通,1966)。 知识被成功激活取决于知识实际存储于记忆中,并在特定情境的刺激下被检索成功。而信息质量研究中使用可得性和可及性来探讨用户有效访问信息的能力(博塞、罗戈瓦,2019)。 依据信息质量研究的相关成果,可得性是一个二进制值,信息可以是可得的,也可以是不可得的。如果信息是不可得的,那么该信息的其他属性都无法纳入考虑范畴。可及性则取决于特定用户限制和应用场景。再者,数据可得性和数据可及性之间,数据可得性是数据可及性的必要条件。即如果数据具有可得性,那么它至少具有一定的可及性(希金斯、金,1981)。 如果数据是不可得的,那么它一定是不可及的。基于上述探讨,本文将数据可得性定义为客观世界中的实体是否被数字化表征,以数据形式存在。数据可及性则定义为可得数据与具体社会情境交互的可能性,是一种数据的潜在表达状态。因此,相比于以往的研究通过数据属性、数据特征来划分大数据类型(陈等,2012;吴等,2014),本文采用数据可及性实现来表示数- -169据与具体社会情境交互的实际发生状态,能够更加准确地反映数据主观事实的构建过程。本文将大数据决策过程中的数据结构甄别为缄默数据、休眠数据和活跃数据3 种类型,具体如表1 所示。在大数据决策中,缄默数据代表未被发掘的决策边界,构成了社会经济价值挖掘的数据潜能;休眠数据蕴含着待激活的决策价值,仅需与合适的应用场景相匹配即可释放数据价值;活跃数据是决策的直接驱动力,通过与跨系统的应用场景交互,为决策的科学性和系统性提供保障。本文以杭州城市大脑大数据应用为例,采用示意图来表示缄默数据、休眠数据和活跃数据的特征及其区别,具体如图1 所示。(二)数据结构类型及特征缄默数据是指囿于现有技术发展水平和人类认知水平的限制,目前无法被人类以任何方式数字化表征的大数据集。缄默数据既不具备数据可得性,也不具备数据可及性。随着先进技术的飞速发展和人类对数据价值认知的不断加深,客观世界中存在的海量缄默数据逐渐有了被数字化表征的可能,其具有的隐藏价值也给了人类无限的遐想空间。例如,近年来,随着“量化自我”理念的推行和可穿戴设备、传感器技术等多领域应用,越来越多的消费者行为被数字化记录。通过对用户出行、饮食、穿着等消费活动在网络上留下的大量数字印记,描绘用户画像来实现精准营销服务成为了一些科技企业竞争优势的来源。然而,尽管一些企业尝试整合若干平台的用户消费集合来分析目标消费者偏好、消费习惯,但考虑到用户画像数据仍然是有限的和不完整的,使得定位营销的精准性大大降低,不仅收效甚微,反而可能造成负面的消费体验。因此,缄默数据的社会经济价值仍然是十分缺失的。休眠数据是指那些已经被数字化表征,但与社会情境交互非常有限,因此“沉淀”于系统中未被激活和使用的大数据集。休眠数据常常受限于数据原位性特征,尚未在跨社会场景中发挥作用,但具备跨社会场景应用的潜力。因此,休眠数据既具有数据可得性,又具备数据可及性。人类可以根据长期积累的知识、经验对休眠数据做出合理的价值预判(鲍林、王,2017),将“沉淀”于系统中的休眠数据投射到复杂的社会情境中,释放更多的数据决策价值。例如,随着政务数字化改革举措的大力推进,我国政务信息工作取得了很大进展,但部门间数据共享机制仍不健全,实际中存在不敢、不愿和不会共享数据的问题。由于缺乏共同的社会经济目标,使得大量休眠数据的价值十分模糊。活跃数据是指那些既被数字化表征,又与跨部门、跨系统的复杂社会情境相交互的大数据集。这些数据通过跨部门、跨系统与复杂的社会情境相互作用,进而发生紧密的跨情境数据关联,将情境交互的可能性转化为现实。活跃数据既具有数据可得性,又实现了数据可及性,常常用于解决社会经济系统复杂问题。例如,在提升城市整体出行效率的目标下,通过贯通公安交警系统、公共交通运营商、城市管理委员会等原本分属于不同部门领域的专用数据,构建一个具有交通出行问题解决目标的新型数据集,从而能够更加精确地识别,并针对性地解决城市交通拥堵问题。四、研究设计(一)研究方法本文采用纵向单案例研究方法进行分析。原因如下:一方面,本文聚焦于大数据决策中数据客观事实向数据主观事实建构转变,以及人类认知在这种转变过程中的作用这一核心问题,具有探索性和归纳性的特征,数据结构类型缄默数据休眠数据活跃数据数据可得性属性不可得性可得性可得性数据可及性属性不可及性可及性可及性实现社会经济价值缺失模糊明确表1 大数据决策中数据结构类型甄别图1 杭州城市大脑大数据决策的数据结构类型示意图大数据决策中数据结构转变:基于杭州城市大脑“交通治堵”应用场景的案例分析公共管理- -170《管理世界》2023年第12期适合采用案例研究方法展开分析(艾森哈特,1989)。 另一方面,杭州城市大脑“交通治堵”大数据决策应用在打通不同部门、行业、机构专用数据“孤岛”的基础上,重塑了城市“交通治堵”的大数据应用场景,并且在“交通治堵”上取得了显著成效,属于大数据应用场景的创新性案例。因此,采用单案例研究方法能够深入探讨这一现象背后的理论规律,进而建构大数据决策的理论模型。(二)案例选择本文遵循案例典型性、主题契合性以及数据可获取性的案例选择标准(艾森哈特,1989),选择杭州城市大脑“交通治堵”大数据应用场景作为研究对象。首先,杭州市于20164 月率先在全国提出建设城市大脑,以城市交通领域为突破口,开启了利用大数据技术破解城市交通拥堵问题的新探索。例如,在2022年高德交通发布的全国50个主要城市拥堵指数排名中,杭州

[返回]
上一篇:生成语言模型表现出社会身份偏见
下一篇:集聚网络视角下企业数字化的生产率提升效应研究