欢迎访问一起赢论文辅导网
本站动态
联系我们
 
 
 
 
 
 
 
 
 
 
 
QQ:3949358033
微信:paperwinner
工作时间:9:00-24:00
经济管理论文
当前位置:首页 > 经济管理论文
社会舆论预测利用融合动力学方程和基于 LLM 的代理
来源:一起赢论文网     日期:2025-05-10     浏览数:91     【 字体:

 社会舆论预测利用融合动力学方程和基于 LLM 的代理

开放获取
发布日期 03 May 2025
第 15 卷,文章编号 15472,(2025 年)
引用本文
下载 PDF
您对此具有完全访问权限
开放获取
 
 
科学报告
社会舆论预测利用融合动力学方程和基于 LLM 的代理
下载 PDF
姚俊驰,张宏杰,欧杰,左定义,郑阳 & 董志成 
972 次访问
 
1 Altmetric
 
探索所有指标
 
抽象
在社交媒体成为社会运动和塑造公众舆论的关键平台的背景下,准确模拟和预测用户意见的动态非常重要。这些见解对于理解社会现象、为政策决策提供信息和引导公众舆论至关重要。不幸的是,基于理想化模型而忽视社交数据的传统算法往往无法捕捉到现实世界社交互动的复杂性和细微差别。本研究提出了融合动力学方程-大型语言模型 (FDE-LLM) 算法。这种创新方法使大型语言模型 (LLM) 中的观点的行为和演变与社交网络上的真实数据保持一致。FDE-LLM 将用户分为两个角色:意见领袖和追随者。意见领袖使用 LLM 进行角色扮演,并使用 Cellular Automata(CA) 来限制观点变化。相比之下,意见追随者被整合到一个动态系统中,该系统将 CA 模型与易感-感染-恢复 (SIR) 模型相结合。这种创新设计显著提高了仿真的准确性。我们的实验利用了来自微博的四个真实数据集。结果表明,FDE-LLM 的性能明显优于传统的基于智能体的建模 (ABM) 算法和基于 LLM 的算法。此外,我们的算法准确地模拟了观点随时间推移的衰减和恢复,强调了 LLM 彻底改变对社交媒体动态的理解的潜力。
 
其他人正在查看类似内容
 
对社交网络中意见帖子传播引起的公众舆论变化进行建模
章节 © 2024
 
舆论动态回顾
章节 © 2016
 
在基于智能体的模拟中研究社交网络演变和意见动态的关键因素
章节 © 2020
介绍
用户意见的动态在引领社会运动和影响公众舆论方面起着至关重要的作用。预测这些动态对于理解社会现象、科学制定政策以及有效引导公共话语至关重要 1,2,3,4。用户观点的形成和演变过程很复杂,受多种因素驱动。因此,准确捕捉这一过程已成为学术和工业领域关注的重点。
 
观点模拟方法分为两类:传统的基于智能体的建模 (ABM) 和基于大型语言模型 (LLM) 的算法。ABM 对个人与当地规则之间的交互进行建模,以模拟意见传播。元胞自动机 (CA) 凭借其结构化网格动力学和局部空间交互,为模拟复杂系统错综复杂的时空演变提供了一个强大的框架5,6。有界置信度模型将心理因素整合到其框架中,包括 Deffuant-Weisbuch (DW) 模型7 和 Hegselmann-Krause (HK) 模型8。由 Clifford9 和 Holley10 开发的选民模型抓住了公共选择动态的本质。此外,实证 ABM 是基于真实数据开发的。Carpentras 利用 ABM 模拟基于真实生活实验 (ABM-RLE) 的态度极化现象 (ABM-RLE)11,而 Duggins 提出了心理动机模型 (ABM-PM) 并复制了两个关于美国人政治观点的经验数据集12。然而,在模拟现实世界时,这些模型仍然无法解决大方差和自衰减问题。
 
基于 LLM 的意见传播算法13 提供了一种创新方法,使用 LLM 代理代替人类社交互动来构建社交网络14,15,16。该框架涉及创建参与互动以传播和预测意见的代理。G. De Marzo 证明,代理在交互中可以自发地形成无标度网络,类似于现实世界的社交网络,例如 Twitter17。此外,斯坦福大学的研究人员还扩展了 LLM 的功能,以存储记忆并实施动态行动计划18。Chuang 等人发现了基于 LLM 的代理的固有偏见,使它们与现实世界的科学共识保持一致19。此外,Liu 等人介绍了一个基于 LLM 的假新闻传播模拟框架 (FPS) 20。
 
在群体模拟的背景下,G. De Marzo 定义了一个“多数力系数”来衡量代理人遵循多数意见的倾向。他们发现,只有当群体规模不超过某个阈值21 时,LLM 社会才能自发地达成共识。为了控制代理的数量,Mou 等人提出了一个混合框架,其中核心用户由 LLM 驱动,同时使用基于演绎代理的模型来刺激普通用户。尽管如此,由于不受约束的意见扩散22,这种方法仍然难以预测对现实世界事件的看法。
 
传统的舆论动力学模型,如 CA 和 HK,在模拟人类无聊或免疫情绪方面存在不足。重复的事件传播导致个人感到无聊,导致他们的观点趋于中立。与此同时,流行病模型,特别是易感-传染-康复 (SIR) 模型,有效地说明了信息是如何传播的 23。因此,可以使用 SIR 模型的概念对人类的无聊进行建模。
 
本研究介绍了一种名为 Fusing Dynamics Equation LLM (FDE-LLM) 的创新意见动力学仿真方法,该方法将 LLM 与 SIR 模型集成在一起。我们的方法设计了一个微博 (https://weibo.com/) 模拟器,其中意见领袖使用 LLM 相互互动,而意见追随者使用 ABM 进行意见传播。然后,我们通过将 CA 与 SIR 模型相结合来限制意见追随者的观点变化,而 CA 模型则限制意见领袖。最后,我们采用 Few-shot 提示来指导意见领袖根据他们的观点价值输出行动,这些价值观由 CA 和 LLM 反思决定。利用开源模型 ChatGLM 作为 LLM 代理,我们在四个真实的微博数据集上进行了实验。结果表明,我们的 FDE-LLM 在动态时间规整 (DTW) 距离和皮尔逊相关系数 (Corr.) 指标上明显优于现有的基于 ABM 和 LLM 的算法。
 
我们的贡献有三个方面:
 
我们提出了一种基于 LLM 的意见传播算法,该算法受动态方程的约束,可实现更真实的宏观模拟结果。
 
我们将舆论动态与 SIR 概念相结合,有效地模拟了新闻发生后公众态度逐渐转向中立的现象。
 
我们使用 ChatGLM 对准确的真实微博数据进行了广泛的实验,展示了与传统的 ABM 和基于 LLM 的算法相比,我们的方法具有卓越的准确性。
 
方法
线下新闻
要使新闻开始在社交网络上传播,它必须使用真实发生的真实事件。这些事件称为 “离线新闻”。
 
在我们的研究中,我们特别选择了以初始阶段和结束阶段之间结果逆转为特征的线下新闻,以下简称“反转新闻”。此类新闻通常以有影响力的意见领袖发布未经证实的说法(谣言)开始,导致一边倒的公众舆论。一段时间后,官方公布真相或调查结果,导致舆论突然相反。随着时间的推移,随着公众逐渐恢复理性判断,平均态度倾向于中立。
 
当使用 LLM 模拟意见领袖时,我们只采用三种态度状态:1、0 和 -124。这使我们能够有效地模拟这个过程: 支持 A \(\rightarrow\) (潜在姿态衰减) \(\rightarrow\) 新闻反转 \(\rightarrow\) 支持 B \(\rightarrow\) 姿态衰减。对于 LLM,生成明确的意见(同意/不同意)比特定值 (0.7) 更容易,因此 -1、0、1 更合适。此外,我们整合了 CA 模型来生成最终意见领袖的态度。
 
数据分析
数据
我们利用中国社交媒体平台微博上的活动关键词作为抓取标记,每天收集每个活动的相关帖子和评论。我们总共收集了 255176 篇帖子。我们的数据收集聚焦于四起高度“反转新闻”:“庞茂”自杀事件(133834)、中学生“江屏”全球数学竞赛第12名(98471)、“青岛”地铁袭击事件(6331)和“叠都记”女孩囤癌视频事件(16540)。我们设计了一个基于 LLM 的小样本代理,以 [-1, 1] 的量表评估所有陈述的态度。每天记录态度值,总持续时间从事件发生之日起计算。此外,消息开始流传,直到整体真实态度稳定下来并接近中立。态度和行动模型基于 GLM4,具有相同的提示以保持逻辑一致性。
 
这四个数据集表现出逐渐降低的互联网讨论强度水平,代表具有四种不同讨论受欢迎程度的事件。这些数据可以更全面地评估我们的模拟方法的有效性。有关意见领袖和意见追随者的详细数据见表 1。
 
以下是在实验期间提取的时间段。
 
庞茂事件(图1a):2024 年 4 月 11 日,一名 21 岁的游戏教练“庞茂”在重庆长江大桥跳下后不幸身亡。2024 年 5 月 2 日,庞茂的姐姐分享了他们与女友的聊天记录截图,引发了广泛争论。2024 年 5 月 19 日,重庆市公安局南安区分局通过“平安南安”平台发布 4 月 11 日事件的官方报告,揭露庞茂姐姐故意引导负面舆情,对社交网络环境构成威胁。
 
江坪事件(图1b):2024 年 6 月 13 日,2024 年阿里巴巴全球数学竞赛最终名单公布。来自江苏省涟水职业学校的 17 岁职业学生江平排名第 12 位,很快引起了广泛关注。2024 年 6 月 21 日,北京大学硕士生赵斌公开指责江平作弊。
 
青岛事件(图 D)。1c):2024 年 8 月 7 日,山东青岛,一名年轻男子据称在地铁上因拒绝让座而被一名老人掌掴和拳打脚踢,导致口鼻流血,引发热议。2024 年 8 月 8 日,黑龙江新闻报报道,涉事青年出现并解释了事件经过,他在视频中表示,“老人抱怨我没有给他座位,但我只给女性座位,为什么我要给他”2024 年 8 月 12 日,警方发布声明,透露该年轻人首先侮辱了老人, 而这件事和“让座”无关。
 
Dianduji 事件(图1d):2024 年 2 月 29 日晚,“点读机少女”高俊瑜在社交媒体上发布视频,表示自己被诊断出患有脑瘤,并剃了光头。在接下来的 11 天里,她的账户发布了 8 个视频,记录了她的手术和恢复过程。2024 年 3 月 11 日,有网友注意到之前视频中的服装与当季不一致,怀疑是“预先录制的视频”。2024 年 3 月 12 日,杭州市余杭区互联网违法有害信息举报中心发布声明,确认视频拍摄于 2023 年 9 月,剪辑于 2024 年 2 月开始。
 
图 1
图 1
事件关系网络图。网络的核心代表意见领袖,而分支机构代表意见追随者。颜色越深,影响越强。
 
全尺寸图像
根据图 1 中的结果,可以进一步获得意见领袖与追随者的比率,如表 1 所示。
 
表 1 意见领袖和意见追随者在不同数据集中的比率分布。
全尺寸表格
分析
通过分析观点随时间的变化,它们表现出以下两个特征:
 
1. 差异大 谣言与真相之间的对比导致态度发生重大变化。在 Dianduji 事件中(图 .2d),态度的极端方差达到 1.4,表明超过一半的人经历了完全逆转。
 
2. 自我衰减 消息传播后,我们注意到好感度上升到某个阈值,然后停止增长,逐渐下降,徘徊在零附近。这种趋势通常通过“质疑真实性”或“双方可能有问题”等中立情绪在真实新闻中捕捉到。例如,在江坪事件中(图2b) 从第 1 天到第 15 天的时间线,支持率从第一天的 0.6 下降到 0.1。
 
为了更好地模拟上述特性,与传统的 ABM 相比,LLM 可以有效地处理较大的方差,从而模拟响应显著态度变化的姿态趋势。此外,通过结合 SIR 模型中的“恢复”概念,我们可以模拟自衰变现象。更多细节请参考图公元 2年至 d.
 
图 2
图 2
红线代表实际数据 (a) 庞茂事件 (b) 将平事件 (c) 青岛事件 (d) 叠都记事件。图中标记的零件是我们需要使用模型进行仿真的关键区域。
 
全尺寸图像
工作流
图 3 说明了 FDE-LLM 算法的整体框架。我们通过 python 开发了一个模拟社交平台,其中意见领袖拥有采取行动的能力(例如评论和转发),而意见追随者则受到意见领袖和追随者的影响。除了能够阅读彼此的行动(评论和转发)之外,意见领袖还会在模拟的开始和结束时阅读离线新闻,代表着“反转新闻”的开始和结束(真相的揭示)。在离线新闻发布之间的间隙,他们将参与讨论和观点变化。
 
首先,意见领袖收到第一条不准确、具有误导性和挑衅性的线下新闻,并采取行动(图 D)。4). LLM-Attitude 评估了对这些行为的后续态度。然后将结果分别传递给意见领袖(由 LLM 和 CA 模拟)和意见追随者(由 CA 和 SIR 模拟)。领导者会将 CA 模型处理的态度视为当前的态度值。在下一轮中,当前姿态值将作为决定行动选择的影响因素之一(图 D)。5). 追随者将通过 CA 和 SIR 模型处理领导者的当前态度值,从而获得自己在当前回合中的态度值。
 
每一轮都是 “一小时”,我们以现实中真相曝光的时间为参考,发布包含当时真相的线下新闻。追随者代表公众,反映舆论走向。因此,在评估态度时,我们将使用意见追随者。通过将真相暴露前后的态度与真实态度进行比较,我们可以评估模拟的有效性。
 
图 3
图 3
FDE-LLM 模拟的工作流程:意见领袖和意见追随者的合作、角色扮演机制以及 CA 和 SIR 模型的集成。
 
全尺寸图像
定义
意见领袖代理
意见领袖是社交网络中意见的发起者。积极的意见领袖通常在关键时刻发挥建设性作用,而消极的意见领袖可能会散布谣言、误导他人,甚至破坏社会稳定。因此,意见领袖的影响力本质上是双重的,因为它可以引导群体朝着积极的目标前进,也可以导致负面后果。
 
根据真实世界的数据集,我们根据用户的个人资料(如评论家、名人、官方媒体账户等)选择和建模意见领袖。(图 .1,表 1)。我们将意见领袖与关注者的比例保持在 1:9,确保模拟中的影响力真实分布。
 
这些代理人有意识地将他们的观点传播或扩散给追随者并引导他们的观点;他们的观点不受意见追随者的影响,只有在态度相似的领导者之间才会有意见的互动。我们通过态度差异阈值来控制这一点。因此,我们获得了多组具有独特态度的领导者。
 
意见追随者代理
我们将不具备上述所有特征的个人定义为意见追随者。实际上,意见追随者缺乏明确的目标意见。
 
在我们的代理框架中,在更新他们的观点的过程中,他们会受到意见领袖和其他意见追随者的相似观点的影响。
[返回]

下一篇:LLM数据集调查从自回归模型到AI聊天机器人