基于区块链的隐私保护可信联邦学习模型 - SCI期刊论文 - 一起赢论文辅导网--专业代写代发SCI、EI、核心期刊、代写MBA、硕博毕业论文。QQ910330594

欢迎访问一起赢论文辅导网

加入收藏 | 设为主页 | 联系我们

本站动态

联系我们

QQ：3949358033

微信：paperwinner

工作时间：9:00-24:00

成功案例

SCI期刊论文

当前位置：首页 > SCI期刊论文

基于区块链的隐私保护可信联邦学习模型

来源：一起赢论文网日期：2022-09-24 浏览数：806 【字体：大中小】

第４４卷第１２期２０２１年１２月计算机学报ＣＨＩＮＥＳＥ ＪＯＵＲＮＡＬＯＦＣＯＭＰＵＴＥＲＳＶｏｌ． ４４Ｎｏ．１２Ｄｅｃ． ２０２１基于区块链的隐私保护可信联邦学习模型朱建明”张沁楠”高胜”丁庆洋２）袁丽萍”１）（中央财经大学信息学院北京１０００８１）２）（北京联合大学管理学院北京１〇〇〇２０）摘要基于联邦学习的智能边缘计算在物联网领域有广泛的应用前景．联邦学习是一种将数据存储在参与节点本地的分布式机器学习框架，可以有效保护智能边缘节点的数据隐私．现有的联邦学习通常将模型训练的中间参数上传至参数服务器实现模型聚合，此过程存在两方面问题：一是中间参数的隐私泄露，现有的隐私保护方案通常采用差分隐私给中间参数增加噪声，但过度加噪会降低聚合模型质量；另一方面，节点的自利性与完全自治化的训练过程可能导致恶意节点上传虚假参数或低质量模型，影响聚合过程与模型质量．基于此，本文将联邦学习中心化的参数服务器构建为去中心化的参数聚合链，利用区块链记录模型训练过程的中间参数作为证据，并激励协作节点进行模型参数验证，惩罚上传虚假参数或低质量模型的参与节点，以约束其自利性．此外，将模型质量作为评估依据，实现中间参数隐私噪声的动态调整以及自适应的模型聚合．原型搭建和仿真实验验证了模型的实用性，证实本模型不仅能增强联邦学习参与节点间的互信，而且能防止中间参数隐私泄露，从而实现隐私保护增强的可信联邦学习模型．关键词区块链；联邦学习；智能边缘计算；差分隐私；共识算法中图法分类号ＴＰ１８ＤＯＩ 号１０．  １１８９７／ＳＰ．  Ｊ．  １０１６．  ２０２１．  ０２４６４ＰｒｉｖａｃｙＰｒｅｓｅｒｖｉｎｇａｎｄＴｒｕｓｔｗｏｒｔｈｙＦｅｄｅｒａｔｅｄＬｅａｒｎｉｎｇＭｏｄｅｌ ＢａｓｅｄｏｎＢｌｏｃｋｃｈａｉｎＺＨＵ ＪｉａｎＭｉｎｇ１）ＺＨＡＮＧＱｉｎＮａｎ１）ＧＡＯ Ｓｈｅｎｇ１）ＤＩＮＧＱｉｎｇＹａｎｇ２）ＹＵＡＮＬｉＰｉｎｇ１）１） ｛Ｓｃｈｏｏｌ  ｏｆ Ｉｎｆｏｒｍａｔｉｏｎ  ？  Ｃｅｎｔｒａｌ Ｕｎｉｖｅｒｓｉｔｙ ｏｆ Ｆｉｎａｎｃｅ  ａｎｄ  Ｅｃｏｎｏｍｉｃｓ  ？  Ｂｅｉｊｉｎｇ１０００８１）２） ｛Ｓｃｈｏｏｌ  ｏｆ Ｍａｎａｇｅｍｅｎｔ？  Ｂｅｉｊｉｎｇ  Ｕｎｉｏｎ  Ｕｎｉｖｅｒｓｉｔｙ，Ｂｅｉｊｉｎｇ１０００２０）ＡｂｓｔｒａｃｔＩｎｔｅｌｌｉｇｅｎｔ  ｅｄｇｅ  ｃｏｍｐｕｔｉｎｇ  ｂａｓｅｄ  ｏｎ  ｆｅｄｅｒａｔｅｄ ｌｅａｒｎｉｎｇ  ｈａｓ  ａ ｗｉｄｅ  ａｐｐｌｉｃａｔｉｏｎ ｐｒｏｓｐｅｃｔｉｎ  ｔｈｅ  ｆｉｅｌｄ ｏｆ  Ｉｎｔｅｒｎｅｔ  ｏｆ Ｔｈｉｎｇｓ（ＩｏＴ）．Ｈｏｗｅｖｅｒ， ｉｔ  ｉｓ  ｓｔｉｌｌ  ｆａｃｅｄｗｉｔｈ  ｔｈｅ ｄｉｌｅｍｍａ  ｏｆ  ｌａｃｋｉｎｇｅｎｏｕｇｈ  ｄａｔａ  ｓｏｕｒｃｅｓ  ｉｎ  ｔｈｅ  ｃｕｒｒｅｎｔ  ｐｒａｃｔｉｃｅ  ｏｆ  ａｒｔｉｆｉｃｉａｌ ｉｎｔｅｌｌｉｇｅｎｃｅ．Ｉｎ  ｔｈｉｓ ｃｏｎｔｅｘｔ，ｄｉｓｔｒｉｂｕｔｅｄｍａｃｈｉｎｅ  ｌｅａｒｎｉｎｇ  ａｇｇｒｅｇａｔｅｓ  ｅｄｇｅ ｄｅｖｉｃｅｓ ’ ｒａｗｄａｔａ  ｉｎｔｏ  ａ  ｐａｒａｍｅｔｅｒ ｓｅｒｖｅｒ ｆｏｒ ｍｏｄｅｌ  ｔｒａｉｎｉｎｇ，ｂｕｔ ｉｔ ｅａｓｉｌｙ ｌｅａｄｓ  ｔｏ  ｄａｔａ ｐｒｉｖａｃｙ  ｌｅａｋａｇｅ  ａｎｄ ｃａｕｓｅｓ  ｅｘｃｅｓｓｉｖｅ ｓｔｏｒａｇｅ  ｏｖｅｒｈｅａｄ．Ｉｎ ｐａｒｔｉｃｕｌａｒ，ｆｅｄｅｒａｔｅｄ ｌｅａｒｎｉｎｇ（ＦＬ）ｉｓａ ｄｉｓｔｒｉｂｕｔｅｄｍａｃｈｉｎｅｌｅａｒｎｉｎｇｆｒａｍｅｗｏｒｋｔｈａｔｓｔｏｒｅｓｄａｔａｌｏｃａｌｌｙ，ｗｈｉｃｈ  ｃａｎｅｆｆｅｃｔｉｖｅｌｙｐｒｏｔｅｃｔｔｈｅｄａｔａｐｒｉｖａｃｙｏｆｅｄｇｅｉｎｔｅｌｌｉｇｅｎｔｎｏｄｅｓ．Ａｃｃｏｒｄｉｎｇｔｏｃｌｉｅｎｔｓｅｔｔｉｎｇｓ， ＦＬ ｃａｎ ｂｅ  ｃｌａｓｓｉｆｉｅｄ ｉｎｔｏ  ｔｗｏ  ｔｙｐｅｓ：ｃｒｏｓｓｄｅｖｉｃｅ ＦＬ ａｎｄ ｃｒｏｓｓｓｉｌｏ ＦＬ．Ｉｎ  ｃｒｏｓｓｄｅｖｉｃｅＦＬ，ａ  ｃｅｎｔｒａｌ  ｅｎｔｉｔｙ  ａｃｔｓ ａｓ ｔｈｅ  ｃｅｎｔｒａｌ  ｐａｒａｍｅｔｅｒ  ｓｅｒｖｅｒ，ｗｈｉｃｈ ｉｓ ａｌｓｏ  ｔｈｅ ｏｗｎｅｒ  ｏｆ  ｔｈｅ  ｇｌｏｂａｌｍｏｄｅｌ．Ｍｅａｎｗｈｉｌｅ， ｔｈｅ  ｐａｒｔｉｃｉｐａｔｉｎｇ  ｎｏｄｅｓ  ａｓ  ｔｈｅ  ｃｌｉｅｎｔｓ  ｔｏ  ｐｅｒｆｏｒｍ ｌｏｃａｌ  ｔｒａｉｎｉｎｇ．Ｉｎ  ｃｒｏｓｓｓｉｌｏＦＬ， ａｌｌ  ｐａｒｔｉｃｉｐａｔｉｎｇ ｎｏｄｅｓ  ａｃｔ  ａｓ  ｔｈｅ  ｃｌｉｅｎｔｓ  ｔｏ ｐｅｒｆｏｒｍ ｌｏｃａｌ  ｔｒａｉｎｉｎｇ．Ｉｎ  ａｄｄｉｔｉｏｎ，ｔｈｅｙ ａｒｅ  ａｌｓｏｔｈｅ  ｏｗｎｅｒｓ  ｏｆ  ｔｈｅ  ｇｌｏｂａｌ ｍｏｄｅｌ  ａｎｄ ｃａｎ ｍａｋｅ  ｕｓｅ  ｏｆ  ｔｈｅ  ｔｒａｉｎｅｄ  ｇｌｏｂａｌ ｍｏｄｅｌ．Ｉｎ  ｔｈｉｓ ｐａｐｅｒ，ｗｅｆｏｃｕｓ  ｏｎ  ｃｒｏｓｓｄｅｖｉｃｅ ＦＬ，ｉｎｗｈｉｃｈ  ｉｎｔｅｌｌｉｇｅｎｃｅ  ｅｄｇｅ  ｄｅｖｉｃｅｓ  ｃａｎ  ｐｒｏｖｉｄｅ ｍｏｄｅｌ  ｔｒａｉｎｉｎｇ  ｓｅｒｖｉｃｅｓ收稿日期：２０２００９１４；在线发布日期：２０２１０５２８．本课题得到国家重点研发计划（２０１７ＹＦＢ１４００７００）、国家自然科学基金项目（６２０７２４８７）、北京市自然科学基金项目（Ｍ２１０３６）、北京联合大学教育科学研究课题ＧＫ２０２１１４），北京联合大学科研专项（ＺＫ３０２０２１０１）资助．朱建明，博士，教授，主要研究领域为区块链技术与信息安全．Ｅｍａｉｌ：ｃｄｅ．  ｅｄｕ．  ｃｎ．张沁楠（通信作者），博士研究生，主要研究方向为区块链与智能边缘计算．Ｅｍａｉｌ：  ｚｈａｎｇｑｎｐ＠１６３．  ｃｏｍ．高胜（通信作者），博士，副教授，主要研究方向为区块链技术与隐私计算．Ｅｍａｉｌ：Ｓｇａ〇＠ｍｋ．  ｅｄｕ．ｃｎ． 丁庆洋，博士，主要研究方向为区块链与大数据治理．袁丽萍，硕士研究生，主要研究方向为区块链技术与隐私保护．１２期朱建明等：基于区块链的隐私保护可信联邦学习模型２４６５ｂｙｓｅｎｓｉｎｇ  ｔｈｅ  ｒａｗ ｄａｔａ  ｆｒｏｍ ＩｏＴ ｄｅｖｉｃｅｓ  ｓｕｃｈ ａｓ  ｉｎｔｅｌｌｉｇｅｎｃｅ  ｖｅｈｉｃｌｅｓ， ｓｍａｒｔｐｈｏｎｅｓ  ｅｔｃ．Ｍｏｓｔ  ｏｆｔｈｅ  ｅｘｉｓｔｉｎｇ  ｃｒｏｓｓｄｅｖｉｃｅ ＦＬ ｉｍｐｌｅｍｅｎｔｓ ｍｏｄｅｌ  ａｇｇｒｅｇａｔｅｄ ｂｙ ｕｐｌｏａｄｉｎｇ  ｔｈｅ  ｉｎｔｅｒｍｅｄｉａｔｅ ｐａｒａｍｅｔｅｒｓｏｆ ｍｏｄｅｌ  ｔｒａｉｎｉｎｇ  ｔｏ  ｔｈｅ  ｐａｒａｍｅｔｅｒ ｓｅｒｖｅｒ．Ｔｈｅｒｅ ａｒｅ  ｔｗｏ  ｐｒｏｂｌｅｍｓ  ｉｎ  ｔｈｉｓ  ｐｒｏｃｅｓｓ．Ｏｎ  ｔｈｅ ｏｎｅｈａｎｄ，ｔｈｅｒｅ  ｉｓ  ｐｒｉｖａｃｙ  ｌｅａｋａｇｅ  ｏｆ  ｉｎｔｅｒｍｅｄｉａｔｅ  ｐａｒａｍｅｔｅｒｓ．Ｔｈｅ  ｅｘｉｓｔｉｎｇ ｐｒｉｖａｃｙ  ｐｒｏｔｅｃｔｉｏｎ  ｓｃｈｅｍｅｓｕｓｕａｌｌｙ ｕｓｅ  ｄｉｆｆｅｒｅｎｔｉａｌ  ｐｒｉｖａｃｙ  ｔｏ  ａｄｄ ｔｈｅ  ｎｏｉｓｅ  ｏｎ  ｉｎｔｅｒｍｅｄｉａｔｅ  ｐａｒａｍｅｔｅｒｓ， ｂｕｔ  ｅｘｃｅｓｓｉｖｅ  ｎｏｉｓｅｗｉｌｌ  ｒｅｄｕｃｅ  ｔｈｅ  ｑｕａｌｉｔｙ  ｏｆ  ｔｈｅ  ｇｌｏｂａｌ ｍｏｄｅｌ．Ｏｎ  ｔｈｅ  ｏｔｈｅｒ  ｈａｎｄ， ｔｈｅ  ｔｒａｉｎｉｎｇ  ｐｒｏｃｅｓｓ  ｏｆ  ｎｏｄｅ  ｓｅｌｆｉｎｔｅｒｅｓｔ  ａｎｄ ｆｕｌｌ  ａｕｔｏｎｏｍｙ ｍａｙ  ｌｅａｄ  ｔｏ ｍａｌｉｃｉｏｕｓ  ｎｏｄｅｓ  ｕｐｌｏａｄｉｎｇ  ｆａｌｓｅ  ｐａｒａｍｅｔｅｒｓ  ｏｒ  ｌｏｗｑｕａｌｉｔｙｍｏｄｅｌｓ，ｔｈｕｓ  ａｆｆｅｃｔ  ｔｈｅ  ａｇｇｒｅｇａｔｉｏｎ  ｐｒｏｃｅｓｓｅｓ  ａｎｄ ｍｏｄｅｌ  ｑｕａｌｉｔｙ．Ｉｎ  ｔｈｉｓ  ｐａｐｅｒ，ｔｈｅ  ｃｅｎｔｒａｌｉｚｅｄｐａｒａｍｅｔｅｒｓｅｒｖｅｒｉｎｆｅｄｅｒａｔｅｄｌｅａｒｎｉｎｇｉｓｃｏｎｓｔｒｕｃｔｅｄａｓａｄｅｃｅｎｔｒａｌｉｚｅｄｐａｒａｍｅｔｅｒａｇｇｒｅｇａｔｉｏｎｃｈａｉｎ，ａｎｄ ｔｈｅ  ｉｎｔｅｒｍｅｄｉａｔｅ ｐａｒａｍｅｔｅｒｓ  ｏｆ  ｔｈｅ ｍｏｄｅｌ  ｔｒａｉｎｉｎｇ ｐｒｏｃｅｓｓ  ｒｅｃｏｒｄｅｄ  ｏｎ  ｔｈｅ  ｂｌｏｃｋｃｈａｉｎａｓ  ｅｖｉｄｅｎｃｅ．Ｍｏｒｅｏｖｅｒ， ｔｈｅ  ｃｏｏｐｅｒａｔｉｖｅ  ｎｏｄｅｓ  ａｒｅ  ｅｎｃｏｕｒａｇｅｄ  ｔｏ  ｖｅｒｉｆｙ ｔｈｅ ｍｏｄｅｌ  ｐａｒａｍｅｔｅｒｓ  ａｎｄｐｕｎｉｓｈ  ｔｈｅ ｐａｒｔｉｃｉｐａｔｉｎｇ ｎｏｄｅｓ ｗｈｏ  ｕｐｌｏａｄ  ｆａｌｓｅ ｐａｒａｍｅｔｅｒｓ  ｏｒ  ｌｏｗｑｕａｌｉｔｙｍｏｄｅｌｓ  ｓｏ  ａｓ  ｔｏ  ｒｅｓｔｒｉｃｔｔｈｅｉｒ  ｓｅｌｆｉｎｔｅｒｅｓｔ．Ｉｎ  ｖｉｅｗ ｏｆ  ａｂｏｖｅ  ｃｈａｌｌｅｎｇｅｓ， ｗｅ  ｔａｋｅ  ｔｈｅ ｍｏｄｅｌ  ｑｕａｌｉｔｙａｓ  ｔｈｅ ｍｅｔｒｉｃ  ｔｏ  ｄｙｎａｍｉｃａｌｌｙａｄｊｕｓｔ  ｐｒｉｖａｃｙｎｏｉｓｅ  ｏｆ  ｉｎｔｅｒｍｅｄｉａｔｅ  ｐａｒａｍｅｔｅｒｓ  ａｎｄ  ｐｒｏｐｏｓｅ  ａ  ｆｅｄｅｒａｔｅｄ ａｄａｐｔｉｖｅ （ＦｅｄＡｄｐ） ｍｏｄｅｌａｇｇｒｅｇａｔｉｏｎ  ａｌｇｏｒｉｔｈｍ．Ｔｈｅ ｐｒｏｔｏｔｙｐｅ  ｄｅｖｅｌｏｐｍｅｎｔ  ａｎｄ ｅｘｐｅｒｉｍｅｎｔａｌ  ｓｉｍｕｌａｔｉｏｎｓ ｓｈｏｗｔｈａｔ ｔｈｅｐｒｏｐｏｓｅｄ ＦｅｄＡｄｐ ｍｏｄｅｌ  ａｇｇｒｅｇａｔｉｏｎ  ａｌｇｏｒｉｔｈｍ ｃａｎ  ａｃｈｉｅｖｅ ｈｉｇｈｅｒ  ａｃｃｕｒａｃｙ  ｏｆ  ａｇｇｒｅｇａｔｉｏｎ ｍｏｄｅｌｗｈｅｎ  ｏｃｃｕｒ  ｐｏｉｓｏｎｉｎｇ  ａｔｔａｃｋ．Ｂｙ ｄｙｎａｍｉｃａｌｌｙ  ａｄｊｕｓｔｉｎｇ  ｔｈｅ Ｌａｐｌａｃｅ  ｒａｎｄｏｍ ｎｏｉｓｅ， ｉｔ’ｓ  ｒｅａｌｉｚｅｄｔｈｅ  ｔｒａｄｅｏｆｆ  ｂｅｔｗｅｅｎｐｒｉｖａｃｙｐｒｏｔｅｃｔｉｏｎａｎｄ ｔｈｅ ａｃｃｕｒａｃｙｅｒｒｏｒ  ｏｆ ｔｈｅａｇｇｒｅｇａｔｉｏｎｍｏｄｅｌ．Ｔｈｅｅｘｐｅｒｉｍｅｎｔ  ｏｆ  ｂｌｏｃｋｃｈａｉｎｐｅｒｆｏｒｍａｎｃｅ ｃｏｎｆｉｒｍｅｄ ｔｈａｔ ｏｕｒｓｃｈｅｍｅ ｈａｓｇｏｏｄ ｐｒａｃｔｉｃａｂｉｌｉｔｙ．Ｉｔ ｉｓｐｒｏｖｅｄ ｔｈａｔ  ｔｈｅ ｍｏｄｅｌ  ｃａｎ  ｎｏｔ ｏｎｌｙ ｅｎｈａｎｃｅ  ｔｈｅ ｍｕｔｕａｌ  ｔｒｕｓｔ  ｂｅｔｗｅｅｎ  ｔｈｅ  ｐａｒｔｉｃｉｐａｔｉｎｇ ｎｏｄｅｓ ｏｆｆｅｄｅｒａｔｅｄ ｌｅａｒｎｉｎｇ，ｂｕｔ ａｌｓｏ  ｐｒｅｖｅｎｔ  ｔｈｅ ｐｒｉｖａｃｙ ｄｉｓｃｌｏｓｕｒｅ ｏｆ  ｉｎｔｅｒｍｅｄｉａｔｅ  ｐａｒａｍｅｔｅｒｓ，ｓｏ  ａｓ  ｔｏｒｅａｌｉｚｅ  ｔｈｅ  ｆｅｄｅｒａｔｅｄ ｌｅａｒｎｉｎｇ ｍｏｄｅｌ ｗｉｔｈ  ｅｎｈａｎｃｅｄ  ｔｒｕｓｔ  ａｎｄ  ｐｒｉｖａｃｙ ｐｒｏｔｅｃｔｉｏｎ．Ｋｅｙｗｏｒｄｓｂｌｏｃｋｃｈａｉｎ；ｆｅｄｅｒａｔｅｄｌｅａｒｎｉｎｇ；ｉｎｔｅｌｌｉｇｅｎｔｅｄｇｅｃｏｍｐｕｔｉｎｇ；ｄｉｆｆｅｒｅｎｔｉａｌｐｒｉｖａｃｙ；ｃｏｎｓｅｎｓｕｓ  ａｌｇｏｒｉｔｈｍｉ引言联邦学习（Ｆｅｄｅｒａｔｅｄ Ｌｅａｒｎｉｎｇ）［１］是一■ 种协作式机器学习框架，参与协作的节点利用本地数据训练模型，通过参数聚合实现多来源数据的预测效果．当前人工智能在实践过程中仍然面临数据来源不足的困境．在医疗领域中，标注数据需动用１万人长达１０年的时间才能收集到足够多有效的数据［２］．联邦学习中数据存储在节点本地实现分布式机器学习，实现了隐私保护的数据协作．随着移动通讯技术和智能边缘设备的兴起，联邦学习在智慧城市［３］、电子医疗［４］、无线通讯［５］、移动边缘网络［６］等领域有着广泛的应用前景［７］．目前联邦学习已产生基于同行业数据的横向联邦学习，以及面向多行业数据的纵向联邦学习与联邦迁移学习［８］，并与大数据、云计算、区块链、智能边缘计算等前沿技术深度融合，成为产学研界共同关注的研究热点．数字经济背景下，数据合规成为世界趋势．２０１８年，欧盟颁布《通用数据保护条例ＫＧＤＰＲ）严格规范数据的使用．２０１７年６月１日起我国施行的《中国人民共和国网络安全法》指出不得泄露、篡改用户数据．２０１９年５月２８日，我国国家互联网信息办公室公开《数据安全管理办法（征求意见稿）》，并于２０２０年１２月１日发布了《常见类型移动互联网应用程序（ＡＰＰ）必要个人信息范围》公开征求意见通知，可见用户数据的流转和使用必须满足越来越严苛的数据管理条例．此外，数据要素具有巨大的潜在价值，但由于行业竞争、利益冲突等因素，大多仍呈现数据孤岛形式．联邦学习满足数据合规，并可以解决数据孤岛问题［９］．大数据时代个人隐私保护一直备受关注．数据隐私的泄露通常会引起公众不满，例如Ｆａｃｅｂｏｏｋ数据泄露曾引发大范围抗议活动，国内求职简历售卖也一度登上了微博热搜．造成数据隐私泄露的主要原因可能是数据在流转过程中丢失，或者利用数据ｍａ：６ 计導机攀报 ＿１ 苹挖掘技术从海量用户信息中＿法遵取个人敏感信息＆ °］ ？数据本身的无限复制特性导致数摒一旦发生泄露、数据》流转和使用难以追踪．联邦学專是当前人工智能背景下实现数据隐私保护的有效办法，根据初始设：置不同．Ｋａｉｍｕｚ等人Ｍ将联邦学习分为跨设备（Ｃｒｏｓｓｄｅｖｉｃｅ｝和跨筒仓（ＣＭＳＳ，ｓｉｌ〇）两种类型．跨设备联邦学习的全局模襲Ｉ＊中心化的参数服务器控１ｉ．跨筒仓联邦学习的每个参与者都Ｗ以暹：全局模型的聚合者和拥有者－本文主要关注跨设备联邦学习，其基本思想是将模型训练分散在ｋ个节点进行，每轮训练结東后参数服务纗收集节．点本地模趣参■数执行模型聚合算法，弁将吏新的全局模型参数返同给各节点继续迭代训练直至讓缉收敏．与分布式机器學习相比，联邦学习具有以下优势八１  ＞参与节点协作训练，利益共享；（幻数据不出节点本地 ＜保护数据隐私并满足数据合规Ｋ３）模型准确率与数据聚合之后训练的准确率＿相当？跨设备联萍学為通过参数服务器执行構型聚合算法４旦中心化参数服务器可能遵聋恶意玫击被截获甚至篡改構型聚合过程的中间参数．此外．中心化参数服务器使参与首点与参数服务器之间存在：太量远程数据通也＃致了数据篡玫与隐私泄露风险．为了解决此问龜／已有学者提出去除第三方的联邦孛石方法［１２］．在该方法中，通过交换用户公匍将模型聚合委托给参与训练的节．点一方来执行．然而，现有的联邦学习隐私保护方案仍存在以下两方面问Ｍ：（１）中间参数隐私泄露：联邦学＿避兔了数据收集而引起的数据泄露ｆ每蘧？但是仍然存在中间参数的隐私泄露［１＇尤其是糖處隐私泄露Ｅ１４］ ？现有机器学习中的模型攻击［１５］、数据攻击ｔｌ６］、推理攻击［１７ｌｓ］ （  Ｉｎｆｅｒｅｎｃｅ  ａｔｔａｃｋ）、滅门：攻击（Ｂａｃｋｄｏｏｒａｔｔａｃｋｓ）：１？键接攻击（Ｌｉｎｋａｂｉｌｉｔｙ ａｔｔａｃｋ）’ ｓ携拳攻击（ＰｏｉｓＤｉｉｉｎｇ ａｔａｃｋ）。１３等方濟都可对中参讖包括梯度数据进行原始数据推断，从而泄露？与节点本地数据的敏感信息．（２）节点多方信任问题？在模虐聚含过程中，可能存在半诚实或＃恶意的参数服务器与参与节点＆２］ ？首先，参数服务器可能滥用或泄露数据，通过将榛虐参数泄露给第兰方获得额外收益；此外＊参％节点由于＿利性考虑，可能会提供虚假参数以提窗活跃度与贡敵度＿＜存在搭便车行为．如揭１所示，假设企业Ａ、Ｂ因数据匮芝有联合建模需求，企业考虑数据隐私采用联邦孥习建模方案？在建模过程中，Ａ、Ｂ无需交操本地数据，只瘍將加密样本对齐，向参数服务器交换中间加密参数，参数服务器执行模型聚＃奪法＊将参数返回给Ａ、Ｂ进行新一轮模型更新，然后不断迭代此过程直至摸．型收敛．在此过程中，假设企业Ｂ遭受恶意攻击而导致数据隐私泄露甚蕈恶意篡玫．由于自利性考虑，》企业Ｂ不愿消耗卄算资源參与训练ｓ但是想要从中获利此选择搭便车上传未经训练的虚假鑫数＊这两种憬况都会影响参数服务器的模■ 聚合．此外Ｉ在执行模型聚合箕法．的过程中也难以避免程序漏洞，从而影响联雜學习协作训练结果．Ｑ国参数服务器＞模型聚合算法参数传输￥模型更新参数传输ｊ模型更新ｌｌａｌ 加密样本对齐 晶圍企ｉｋＡ￣＇企＾ＩｋＢ＾恶意攻击；ｆ；自身作恶＃程序漏洞图１參与曹点麓销＊虜釐屢ａｆｔｍ本可１＃参数廉．器综上所述，为了解决跨设备联邦孪习中间参数隐私泄露以及多方互信何题，本文将中心化的参数服务器构建为去中心化的参数聚合链，其中参与训＿节点＆将中间＃数上传至区块链＝逋过共识算法与智能合约进行参数验证和模＿聚合，经过共轵验证后的聚合模ａ参数返回給各参与节点进行檫型棄新．根据模型质量与节点信誉评分调整聚含权重，降低误差较大模型参数所占比重，从而提升聚合襟塑的准确率？基宁这一研究思路，苹文基于ｂ有文献［２２］利用差分隐私实现联邦学方中间善数的隐私保护．并投计协作者异步参数＇审计机制对模遨威量评估结果进行共识验证，防止搭便车行为《同时基于模型质量与，誉评分构建启适应的模ａ聚含算法，并通过智能合约＆动触发算法执行．与现有的基于区块链的联邦学习的工作相比，本文主養貢鑛，归轴为：⑴ 自适盧隨儀型歎含与隐私感ｆｎ？本文交朱建明等：基于区块链的１２期 隐私保护可信联邦学习模型 ２４６ ７叉熵（Ｃｒｏｓｓ Ｅｎｔｒｏｐｙ）？为模型质量评估依据，基于模型质量与节点累计信誉值设计自适应的模型聚合算法．其次，基于差分隐私保护联邦学习中间参数隐私，根据模型质量评估结果在中间参数基础上增加不同程度的拉普拉斯（Ｌａｐｌａｃｅ）？噪声，防止中间参数在传输过程中泄露本地数据隐私．（２）区块链模型参数审计与共识．利用区块链去中心化和强信任属性，对模型参数进行协作者参数审计，有效识别恶意节点的投毒攻击与搭便车行为．本文提出节点贡献度证明（Ｐｒｏｏｆ  ｏｆ Ｃｏｎｔｒｉｂｕｔｉｏｎ，ＰｏＣ）共识算法，降低高贡献度节点共识挖矿难度，减少计算资源浪费，提升节点参与公平性．（３）支持轻量级智能边缘计算．目前已有的基于区块链的联邦学习工作［２＂２６］大多将联邦学习节点构建为点对点（ＰｅｅｒｔｏＰｅｅｒ）的区块链结构，本文将区块链和联邦学习分层构建，适用于轻量级智能边缘计算场景中的联邦学习．其中，区块链作为模型聚合引擎，通过智能合约实现模型参数的自动化可配置聚合操作，降低了中心化参数服务的恶意攻击与计算偏差风险．轻量级智能边缘计算节点仅需完成本地模型训练和参数更新，无需承担区块链节点面临的数据冗余和共识过程中的通信开销．（４）仿真实验与安全性分析．使用ＭＮＩＳＴ和ＣＩＦＡＲ１０数据集，基于拉普拉斯差分隐私测试在固定隐私噪声与动态隐私噪声情况下，ＭＬＰ与ＣＮＮ模型训练的准确率对比情况．通过模拟投毒攻击，进一步展示自适应模型聚合算法的抵御效果．利用Ｐｙｔｈｏｎ Ｆｌａｓｋ搭建区块链平台，为联邦学习提供去中心化的模型聚合服务．大量实验表明，当参与节点使用本模型进行联邦学习模型训练，计算时间开销与存储开销较小，说明本模型有较好的实用性．２相关工作２．１联邦学习的隐私保护联邦学习最早被Ｇｏｏｇｌｅ提出用于用户输人法预测，

[返回]

上一篇：面向可信联盟的区块链账本可验证修改方法研究
下一篇：互联网内生安全体系结构研究进展