通过原位反向传播训练全机械神经网络以进行任务学习 - 机械论文 - 一起赢论文辅导网--专业代写代发SCI、EI、核心期刊、代写MBA、硕博毕业论文。QQ910330594

欢迎访问一起赢论文辅导网

加入收藏 | 设为主页 | 联系我们

本站动态

联系我们

QQ：3949358033

微信：paperwinner

工作时间：9:00-24:00

成功案例

机械论文

当前位置：首页 > 机械论文

通过原位反向传播训练全机械神经网络以进行任务学习

来源：一起赢论文网日期：2024-12-13 浏览数：764 【字体：大中小】

通过原位反向传播训练全机械神经网络以进行任务学习

最近的进展揭示了物理神经网络是有前途的机器学习平台，可提供更快、更节能的信息处理。与广泛研究的光学神经网络相比，机械神经网络的发展仍处于起步阶段，面临着重大挑战，包括繁重的计算需求和近似梯度的学习。在这里，我们介绍了原位反向传播的机械模拟，以实现机械神经网络的高效训练。我们从理论上证明，精确的梯度可以在局部获得，从而能够通过附近进行学习，并通过实验证明了这种反向传播以获得高精度的梯度。利用梯度信息，我们展示了在行为学习和机器学习任务模拟中成功训练网络，在回归和分类实验中实现高准确性。此外，我们提出了涉及任务切换和损害的网络的可再训练性，展示了弹性。我们的研究结果将训练机械神经网络的理论与实验和数值验证相结合，为机械机器学习硬件和自主自学材料系统铺平了道路。

其他人正在查看类似内容

使用反向传播训练的深度物理神经网络

文章开放获取 26 一月 2022

通过绗缝策略建立深度材料网络：可视化以实现可解释性，并通过递归训练提高准确性

文章开放获取 25 七月 2023

通过主动学习和数据增强为软机器设计自动应变传感器

报道 2022-1-26

介绍

过去几十年见证了人工智能以前所未有的速度发展，机器学习成为其最具变革性的分支之一。现代机器学习的核心是神经网络，这种计算模型受到人脑复杂运作的启发1,2.神经网络已经彻底改变了各个领域，从图像识别到自然语言处理和自动驾驶3、4、5.与传统编程不同，传统编程需要提供明确的指令来解决问题，而神经网络则从数据中学习以做出决策6,7.这个学习过程涉及通过反向传播调整网络内互连节点或神经元的参数，以进行梯度下降8,9.最终，神经网络可以揭示数据中的复杂模式和关系，使它们能够泛化到看不见的示例并以非常高的准确性执行任务。

然而，与基于计算机的神经网络相关的大量计算要求和能耗，特别是考虑到传统数字处理器的能源效率，对进一步开发提出了重大挑战10,11 元.一种提出的解决方案是依赖于物理过程的物理机器学习硬件平台，例如光学和机械神经网络，与数字网络相比，这些平台有望实现更高的能源效率12,13,14,15,16,17,18,19,20,21 元.例如，经过广泛研究的光学神经网络比使用数字乘法器的电子处理器具有几个数量级的能量优势17.此外，高效可行的光学神经网络原位反向传播训练方法促进了有前途的物理机器学习平台和碳足迹的减少14、18、22 元.

波-物质相互作用通常用于光学神经网络中以实现机器学习，采用的机制包括衍射以及递归神经网络与波物理学之间的等效性14,23 元.类似的思路也被用来建立机械神经网络（MNN）中的学习框架21,24 元.另一种提出的方法使用由声波激活的振动板作为输入和输出。这种方法不是通过直接调整权重来训练神经网络，而是在训练过程中使用来自干扰声波的电生成的屏蔽信号19.这个想法通过添加多层振动板进行了扩展，从而形成了一个深度物理神经网络20.预计 MNN 将在具有复杂电磁条件的挑战性环境中表现出优势，而光学对应物的性能可能会不佳。

尽管采用了有效的基于波的实现，但波动力学很复杂，涉及实际材料系统中的多种共振模式，这导致物理系统的动力学建模面临挑战，这可能会导致较大的仿真-现实差距。相比之下，MNN 在静力下诱导的物理变化为解决这些挑战提供了一种有前途的解决方案，这已被证明可以学习行为（设计材料在负载下的期望响应）25,26 元.然而，使用在计算机上运行的优化算法（例如，遗传算法）的方法最终依赖于传统的数字处理器。因此，在依赖于物理过程和相应实验演示的高效训练方法方面存在挑战。

有鉴于此，物理学习的概念提供了一个有前途的途径，可以仅根据网络的本地信息来训练 MNN，这受到神经科学的启发27.这种方法很有前途，适用于在系统中实际进行学习的实验性实现。一种方法称为耦合学习，它使用两种平衡状态（自由状态和微移状态）的对比来更新系统，并能够解决给定的任务28,29,30,31 元.这种方法使 MNN 能够在监督式机器学习任务中表现良好。每次将力模式的训练示例应用于 MNN 时，它都会根据学习规则进行自我更新。随着时间的推移，MNN 学会了准确响应具有类似于训练示例中的空间相关模式的看不见的力量。

另一种著名的物理学习方法是平衡传播（EP），它与耦合学习共享类似的过程，并且能够定义任意可微损失函数32.这种方法已经在各种物理系统中得到了验证，在非线性电阻网络中以数值方式进行了验证33和耦合相位振荡器34，在 Ising 机器上进行实验35.

到目前为止，基于物理学习的 MNN 是使用折纸结构平台开发的28,36 元和无序网络29,37 元通过模拟演示机器学习。实验建议涉及使用具有可变刚度的定向弹簧38并手动调整弹簧的剩余长度31.

在这里，我们通过原位反向传播的机械模拟提出了一种高效的 MNN 训练协议，该协议源自伴随变量方法，其中理论上只能从局部信息中获得精确的梯度。通过使用 3D 打印的 MNN，我们证明了仅使用局部规则，仅用两步就从 MNNs 的键伸长实验中获得损失函数梯度的可行性，精度很高。此外，利用获得的梯度，我们展示了在用于行为学习和各种机器学习任务的机械网络模拟中的成功训练，在回归和鸢尾花分类任务中实现了高准确性。然后对训练后的 MNN 进行数值和实验验证。此外，我们说明了 MNN 在切换任务和损伤后的可再训练性，这一特征可能会激发对 MNN 更稳健和有弹性的设计的进一步研究。

除了用作计算设备之外，这些 MNN 作为可持续和自主的材料系统，还为材料科学和机械工程提供了前所未有的机会，因为它们可以接受训练以学习某些行为以适应不同的环境和任务。在工程学中，很少有例子表明材料或机器具有在没有细致设计和工程的情况下表现出所需行为的先天能力。但是，设计策略需要专业知识和经验。此处提出的 MNN 以及高效的训练协议也为未来的智能材料系统铺平了道路。

结果

机械神经网络中的原位反向传播

我们首先介绍了在 MNNs 中进行原位反向传播的理论基础，即获得损失函数相对于 MNN 弹簧常数的梯度。这里，我们在 d 维空间中嵌入了 n 个节点，位于位置 {xj}.输入和输出节点的数量为 n在和 n外分别。节点由 m 个线性弹簧连接，每个弹簧都有一个弹簧常数 k我.此外，通过正确设计网络连接来禁止零模式，以便对兼容性矩阵 C 进行完全排序，这将在后面介绍。与具有逐层结构的典型基于计算机的神经网络相比，MNN 被视为整个网络。给定给定的任务，任务学习问题可以描述为：

$$\begin{array}{rcl} &&{{\rm{minimize}}}_{k}\quad{{{\mathcal{L}}}}[u（k）]，\\ &&{{\mbox{subject to}}}\quad Du=F，\end{array}$$ (1)

其中\（{{{{\mathcal{L}}}}}\）是损失函数，\（k\in {{\mathbb{R}}}_{\ge 0}^{m\times 1}\）是一个向量，包含每个键的弹簧常数，这是可训练的学习自由度，\（D\in {{\mathbb{R}}}^{dn\times dn}\）是对称的刚度矩阵（在不同上下文中也称为Hessian矩阵或动力学矩阵）， \（u\in {{\mathbb{R}}}^{dn\times 1}\）是节点位移，即输出，\（F\in {{\mathbb{R}}}^{dn\times 1}\）是施加在节点上的外力，即输入。静力学的控制方程 Du = F 表示正向问题，反映了 MNN 在输入力 F 下的响应 u（每个节点的位移）。为了使用梯度下降来最小化 \（{{{{\mathcal{L}}}}}[u（k）]\），\（\nabla {{{{\mathcal{L}}}}}\）推导出如下：

\nabla {{{{\mathcal{L}}}}}=\frac{d{{{{\mathcal{L}}}}}}{dk}=\frac{\partial {{{{\mathcal{L}}}}}}{\partial u}\frac{du}{dk}. (2)

给定损失 \（{{{{\mathcal{L}}}}}\）作为 u 函数的形式，雅可比矩阵 \（\frac{\partial {{{{\mathcal{L}}}}}}{\partial u}\）可以方便地计算，而通常 \（\frac{du}{dk}\）由于节点之间的相互作用而是一个计算量很大的项。例如，通常情况下，\（\frac{\partial {{{{\mathcal{L}}}}}}{\partial u}\）的计算成本是 \（{{{{\mathcal{O}}}}}（d{n}_{{{{{\rm{out}}}}}}）\），但 \（\frac{du}{dk}\）的计算成本是 \（{{{{\mathcal{O}}}}}（dmn）\）。我们如下所示，该项可以从两侧 Du = F 的微分中得出：

$$\frac{du}{dk}=-{D}^{-1}\frac{dD}{dk}u，$$ (3)

与 \（\frac{d}{dk}F={{{{\bf{0}}}}}\）。然后将方程（3）代入方程（2）：

$$\nabla {{{{\mathcal{L}}}}}=\frac{\partial {{{{\mathcal{L}}}}}}{\partial u}\left（-{D}^{-1}\frac{dD}{dk}u\right）={u}_{{{{{\rm{adj}}}}}}^{T}\frac{dD}{dk}u.$$ (4)

这里我们用伴随位移\（{u}_{{{{{\rm{adj}}}}}}^{T}\）的转置来表示\（-\frac{\partial {{{{\mathcal{L}}}}}}{\partial u}{D}^{-1}\）得到\（{u}_{{{{{\rm{adj}}}}}}^{T}D=-\left（\frac{\partial {{{{\mathcal{L}}}}}}{\partial u}\right）\）。请注意，D 是一个对称矩阵，使得 D = DT.因此，在对两侧进行转置后，伴随问题可以定义如下：

$$D{u}_{{{{{\rm{adj}}}}}}=-{\left（\frac{\partial {{{{\mathcal{L}}}}}}{\partial u}\right）}^{T}.$$ (5)

显然，这两个问题（前向和伴随）的力量不同。同样，伴随问题可以理解为响应 u调整在伴随力 \（-{\left（\frac{\partial {{{{\mathcal{L}}}}}}{\partial u}\right）}^{T}\）下的 MNN。

然后，我们利用兼容性矩阵39,40 元， \（C\in {{\mathbb{R}}}^{m\times dn}\）将节点位移 u 映射到线性状态中的键伸长率 e，使得 \（{e}_{i}={\hat{I}}_{{j}_{1}\，{j}_{2}}\cdot （{u}_{{j}_{1}}-{u}_{{j}_{2}}）\），其中 \（{\hat{I}}_{{j}_{1}\，{j}_{2}}\）是指向节点 j 的单位向量1到节点 j2，它确定 C 中的每个条目。此外，刚度矩阵 D 可以分解为 CTKC，其中 K 是对角矩阵，k 作为对角线项。方程（4）中 \（{{{{\mathcal{L}}}}}\）的梯度可以进一步表示为：

$$\nabla {{{{\mathcal{L}}}}}={u}_{{{{{\rm{adj}}}}}}^{T}\frac{dD}{dk}u={u}_{{{{{\rm{adj}}}}}}^{T}\frac{d（{C}^{T}KC）}{dk}u={u}_{{{{{\rm{adj}}}}}}^{T}{C}^{T}\frac{dK}{dk}Cu={e}_{{{{{\rm{adj}}}}}}\circ e，$$ (6)

其中 ∘ 是 Hadamard 乘积（即元素乘积）。\（\frac{dK}{dk}\）是一个张量 \（{\delta }_{pql}\in {{\mathbb{R}}}^{m\times m\times m}\），其中当 p = q = l 时，条目为 1，否则为 0。方程（6）意味着损失函数 \（{{{{\mathcal{L}}}}}\）的梯度等于正向问题 Du = F 和伴随问题 \（D{u}_{{{{{\rm{adj}}}}}}=-{\left（\frac{\partial {{{{\mathcal{L}}}}}}{\partial u}\right）}^{T}\）的元素乘积。

因此，要在 MNNs 中实现原位反向传播，并从 MNN 的局部信息中获得损失函数 \（{{{{\mathcal{L}}}}}\）的梯度，有两个步骤：（1）对 MNN 施加输入力 F，得到节点的位移和键 e 的正向伸长。（2）在给定损失函数 \（{{{{\mathcal{L}}}}}}{\partial u}\right）\）的情况下，使用步骤（1）中的位移和数字计算机中的计算成本 \（{{{{\mathcal{O}}}}}（d{n}_{{{{{\rm{out}}}}}}）\）计算损失函数 \（{{{{\mathcal{}}}}}L\m{n}_\rm{out）\）的形式。请注意，只有 \（-\left（\frac{\partial {{{{\mathcal{L}}}}}}{\partial u}\right）\）中的非零项才会被计算到与输出节点相对应，例如，\（{{{{\mathcal{L}}}}}={（{u}_{p}-{u}_{T}）}^{2}\）用于让节点 p， u 的位移p，接近所需的位移 uT，则伴随力的唯一非零条目将是 2（uT− up).将力 \（-{\left（\frac{\partial {{{{\mathcal{L}}}}}}{\partial u}\right）}^{T}\）施加到同一坐标系上，以获得键 e 的伴随伸长率调整.梯度是向前伸长和伴随伸长的单元乘积，计算成本为 \（{{{{\mathcal{O}}}}}（m）\），其中 m 是键数。

与引言中描述的基于能量的学习方法类似，例如 EP 和耦合学习，我们的方法还引入了由正向力 F 和伴随力 \（-{\left（\frac{\partial {{{{\mathcal{L}}}}}}{\partial u}\right）}^{T}\）引起的两种平衡状态。然而，在基于能量的学习方法中，微移状态与由轻推强度控制的自由状态略有距离，而我们方法中的两种平衡状态是独立的，其中输入力在第二种状态中不存在。此外，从算法上讲，两种平衡状态之间的差异近似于基于能量的学习方法中的梯度，但我们的方法通过乘法产生梯度，在 MNN 中执行反向传播。在补充信息中，我们展示了 EP 和我们的方法之间的联系。值得注意的是，在线性状态下，尽管程序和算法不同，我们的方法和 EP 产生相同的结果。

当我们进一步考虑伴随力 \（-{\left（\frac{\partial {{{\mathcal{L}}}}}}{\partial u}\right）}^{T}\）的形式时，其中非零项为 2（uT− up），它可以被视为 output 和期望 output 之间的误差。因此，本质上我们的方法提供了两个信号传递，一个前向传递发送输入信号，一个向后传递发送误差信号，让人想起光学神经网络中基于伴随方法的反向传播14、22、41 元.此外，最近关于训练化学信号网络的工作显示了类似的过程和结论，其中浓度下降和沿键的压降产生梯度，由系统矩阵的特殊形式得出42.同样，在我们的线性 MNN 中，伸长率可以被视为沿键的位移下降，因此学习规则具有共同特征。

更重要的是，这种原位反向传播方法与物理学习所需的当地规则保持一致30，因为键 i 的梯度可以仅从键 i 的伸长率中获得，即 \（\nabla {{{{{\mathcal{L}}}}}}_{i}={e}_{{{{{\rm{adj}}}}}，i}{e}_{i}\）。除了 EP 和耦合学习之外，我们的方法还可以作为在本地训练 MNN 的替代选择。我们的学习规则严格适用于线性状态，表明利用 MNN 的小变形来发挥作用。

随后，通过上述两个步骤在每个键 i 处局部获得的梯度 \（\nabla {{{{{\mathcal{L}}}}}}_{i}\）用于以学习速率 α 从 k 更新弹簧常数我到 \（{k}_{i}-\alpha \nabla {{{{{\mathcal{L}}}}}}_{i}\）

$${k}_{i}\leftarrow {k}_{i}-\alpha \nabla {{{{{\mathcal{L}}}}}}_{i}={k}_{i}-\alpha {e}_{{{{{\rm{adj}}}}}，i}{e}_{i}，$$ (7)

通过梯度下降迭代，最小化受物理定律约束的损失函数。

在这里，为了演示 MNN 中的原位反向传播，我们使用 3D 打印技术制造了由柔性 Agilus30 制成的二维 MNN，如图 3 所示。1个详细的制造程序和配置显示在方法和补充信息中。例如，我们以损失函数为例，在向下施加的力 F 下为 \（{{{{\mathcal{L}}}}}={（{u}_{Ly}+0.025{{{\rm{m}}}}}）}^{2}\）Ry= 0.01 × 9.8N，其中 uLy和 FRy表示 MNN 左下角节点的垂直位移和 MNN 右下角节点上施加的力。MNN 顶部最左侧和最右侧的侧面作为固定边界条件粘在桁架上。该力由权重通过重力施加。

图 1：原位反向传播的实验演示。

图 1

使用 Polyjet 橡胶类材料 Agilus30 的 3D 打印机械神经网络。b 前场和伴随场的实验设置，以及模拟和实验得到的损失函数梯度分别从左到右显示。第三个面板中的误差线是根据三个独立实验的标准差计算的。前场和伴随场是通过物理方式获得的。伴随力和单元乘法是通过计算机获得的。c 前向场和伴随场的实验伸长分别显示在第一和第二面板中。实验梯度显示在第三个面板中。d 相应的模拟伸长率和梯度从左到右显示。e 有限差分法和我们的伴随法之间的比较。左侧面板中的黑色曲线显示了有限差分法中数值误差与步长的函数关系。阴影区域表示具有较大步长的实验可行区域，低于该区域时，步长 Δk 与制造精度相比太小。伴随法的数值误差取决于线性状态下的机器精度。右面板中的橙色曲线表示当变形不是无穷小且 MNN 的响应是非线性时的梯度误差。还显示了使用伴随方法的实验误差。源数据作为源数据文件提供。

全尺寸图像

图 1 b 显示了实现原位反向传播的机械模拟的实验设置。第一个面板显示 FRy以 10 g 的重量施加在右下角的节点上。图 1 的第一个面板。1c 显示了每个键的实

[返回]

上一篇：深度神经网络具有内置的奥卡姆剃刀
下一篇：复杂网络系统的深度学习弹性推理