欢迎访问一起赢论文辅导网
本站动态
联系我们
 
 
 
 
 
 
 
 
 
 
 
QQ:3949358033

工作时间:9:00-24:00
博士论文
当前位置:首页 > 博士论文
分布式自动驾驶实验室的动态知识图谱方法
来源:一起赢论文网     日期:2024-02-06     浏览数:96     【 字体:
 
 
实验室自动化的概念,最近被重新解释为自动驾驶实验室 (SDL)1,2,自 1960 年代以来一直存在,当时参考文献。3推出第一款自动化化学硬件。从那时起,SDL 在化学领域得到了广泛的采用4,5,6,7材料科学8,9生物工艺学10,11和机器人技术12,从而加速了科学发现和社会发展。然而,SDL 的实施可能具有挑战性,通常需要一支高度专业化的研究人员团队,他们拥有化学、工程和计算机科学方面的专业知识。因此,研究通常由一个组织内的大型研究小组进行。即使在研究小组之间进行合作的情况下,SDL 通常也集中在同一个实验室内。
 
为了应对当今紧迫的全球挑战,科学界越来越一致地认为,有必要向全球合作研究网络转变范式13、14、15 .这种转变需要分散 SDL,以整合不同的研究小组,为解决新出现的问题贡献他们的专业知识16.这种权力下放在支持各种任务方面具有巨大潜力,包括在实验研究中自动表征认识不确定性17推进人类在深空的探索18.实现这一愿景并非易事,涉及三大挑战。第一个挑战是高效编排异构资源19,其中包括来自不同供应商和不同计算环境的硬件。第二个挑战是跨组织共享数据20,这需要标准化的研究交流语言21.在此过程中,需要跟踪研究的来源和元数据,以提高可重复性,这导致了遵循FAIR原则的数据来源记录的第三个挑战——可查找、可访问、可互操作和可重用22.
 
为了应对这些挑战,已经进行了许多尝试,但重点各不相同。对于资源编排,中间件,如 ChemOS23升级24和 HELAO25存在是为了将不同的组件粘合在 SDL 中并抽象化硬件资源。对于数据共享,χDL26,27和 AnIML28分别是为合成和分析而开发的标准方案的示例。在数据来源领域,Mitchell等人。29提出了一个数据管道来支持COVID大流行的建模,而参考文献。30设计了一个知识图谱来记录材料研究中的实验来源。尽管这些研究为构建协作研究环境提供了见解,但它们是通过定制的数据接口单独开发的。加强这些系统内部和之间的互操作性对于建立真正互联的研究网络至关重要。
 
正如我们之前的工作所讨论的31,32、语义网技术,如知识图谱33提供一条可行的前进道路。本体使用相同的概念抽象资源和数据,允许参与者在分配任务和共享结果时使用共同语言。世界阿凡达34,35就是这样一个知识图谱,旨在涵盖科学研究实验室的所有方面,如图所示。1a 整体:实验本身,包括其物理设置和基础化学;可以是人类或机器人性质的移动处理程序;以及提供必要基础设施和资源的实验室36.World Avatar 通过将软件代理编码为可执行的知识组件,超越了静态知识表示,实现了动态和持续整合新概念和数据,同时保留了与现有信息的联系。随着知识图谱的扩展,这一特性允许从实验过程中捕获数据来源作为知识陈述,有效地充当现实世界的活副本。这种动态知识图谱简化了 SDL 之间数据的即时传播,为上述挑战提供了有前途的整体解决方案32,37以及追求诺贝尔图灵挑战36,38.
 
图 1:World Avatar 对全球互联实验室数字孪生方法的概述。
图1
a 化学研究实验室需要代表的三个相互关联的方面,改编自36.处理程序集与需要移动设备实际参与的任务有关。实验集包括固定单元,特别是硬件和化学品。实验室集代表环境条件和建筑基础设施。交叉区域象征着实验室内微妙的角色,需要对所描绘的集合具有专业知识。这三个圈子的交汇点是世界阿凡达项目,该计划旨在熟练整合这些基本方面的专业知识。本文重点关注化学反应优化的自动化,这项任务可以被视为许多研究科学家日常工作的一部分。实验室玻璃和原子的插图是使用 istockphoto.com 创建的。b 剑桥和新加坡的两个实验室相互连接,以展示实时协作闭环优化。该过程由研究科学家的目标请求触发,并保留所有数据来源。这项工作中发达的基础设施有助于建立分布式自动驾驶实验室。
 
全尺寸图像
在这项工作中,我们演示了由动态知识图谱支持的分布式 SDL 网络的概念验证。这标志着迈向数字研究科学家的第一步(如图所示)。1a) 自主协作。为了说明这种方法的有效性,如图所示。1b,我们展示了一个演示,使用剑桥和新加坡的两个机器人合作解决多目标闭环优化问题,以响应科学家的目标要求。
 
结果
分布式 SDL 的体系结构
SDL 中的闭环优化是一个动态过程,围绕设计-制造-测试-分析 (DMTA) 周期展开39,40.与仅捕获数据流的机器学习系统和科学工作流程相比,SDL 通过编排计算和物理资源提供了一种集成方法。这涉及数据和物质流的集成,以及弥合虚拟世界和物理世界之间差距的接口。为此,我们提出了一种分布式 SDL 的概念架构,该架构有效地整合了所有三个流程,如图所示。2一个。
 
图 2:分布式自动驾驶实验室 (SDL) 架构图示。
图2
a 用于构建分布式 SDL 网络以实现闭环优化的组件概念框架。该框架包括数据、软件、硬件和工作流程的整体整合,同时考虑到网络空间内的信息流和物理空间内的材料流。在科学家规范的推动下,这些流程在网络和物理空间中自主发展,直到它们完成研究目标或耗尽分配的资源。实验设计的插图由参考文献创建。81.b 动态知识图谱方法,分为三层。第一层代表现实世界,硬件所在的位置和反应发生的地方。第二层由网络空间中的动态知识图谱组成,托管硬件和化学数据的数字孪生等信息。第三层包括持续监控知识图谱状态、动态重组知识图谱并推动现实世界变化的主动代理。docker 的插图是使用 flickr.com 创建的。
 
全尺寸图像
拟议的架构提供了一个框架,使科学家能够为特定的化学反应设定研究目标和资源限制,并让他们在网络空间中触发闭环过程。该过程由监控组件启动,该组件解析研究目标并请求实现目标所需的迭代。迭代组件收集有关设计空间的先验信息,并将其传递给设计下一个实验的组件。所采用的算法以及先验数据的可用性决定了在科学家提供的搜索空间内提出的设计变量的组合。随后,拟议的物理实验计划在其中一个可用的实验室中执行,类似于高性能计算作业的调度41.建议的条件被转化为机器可操作的配方,从而能够控制用于反应和表征的硬件。在现实世界中,这反映在两台设备之间的物料流中。然后,数据处理组件负责通过分析完整的作业信息和原始数据来计算目标。如果资源仍然可用,则将这些目标与研究目标进行比较将确定系统是否应继续进行下一次迭代。
 
这种架构将科学家从日常工作中解放出来,然而,在确保健壮性、可扩展性、可维护性、安全性和道德性方面,它也给实施带来了挑战。理想情况下,系统应能够无缝集成新设备、资源和算法,而不会中断系统的整体功能。允许动态适应研究目标和资源限制的变化也很重要。
 
我们相信动态知识图谱技术可以帮助实现这种架构32.具体来说,如图所示。2b,该技术将软件组件抽象为接收输入并产生输出的代理。这些组件之间的数据流表示为在这些代理之间交换的消息。物理实体可以虚拟化为网络空间中的数字孪生,从而在涉及多个实验室时实现实时控制并消除地理空间边界。这种对闭环优化问题的重新表述,即信息在知识图谱中传播并反映它们在现实世界中的变化,为实现真正的分布式 SDL 提供了一个强大的框架。通过这种方式,我们可以将物理实验的发生视为一系列动作,这些动作会随着反应实验的进行而动态生成有关信息,类似于计算工作流程42.
 
这项工作是一系列论文的一部分,这些论文通过包括研究实验室的所有方面来引入实验室自动化的整体方法(见图1)。1a) 在包罗万象的数字孪生中36.通过采用整合不同领域知识模型的动态知识图谱,我们可以解决基于平台的方法中常见的互操作性和适应性方面的挑战32.目标驱动的架构有助于跨知识库进行推理,允许将高级抽象目标分解为特定的子目标和更具体的任务。在这个框架内,人类扮演着双重角色,既是目标设定者,又是执行和干预实验的操作者(必要时)。当充当操作员时,人类可以像机器人一样在知识图谱中表示,并且他们以人类可读的格式接收指令。这有助于实现混合和不断发展的数字实验室,弥合潜在的“临时技术差距”43.这项工作中描述的操作是通过机器人处理进行的,人类主要参与初始材料的准备和设备的维护。
[返回]
上一篇:数据驱动型地球系统科学的深度学习和过程理解
下一篇:噪音过滤和深度学习相结合的安全缺陷报告识别