欢迎访问一起赢论文辅导网
本站动态
联系我们
 
 
 
 
 
 
 
 
 
 
 
QQ:3949358033
微信:paperwinner
工作时间:9:00-24:00
博士论文
当前位置:首页 > 博士论文
通过基于 LLM 的动态航路点生成实现强大的移动机器人路径规划
来源:一起赢论文网     日期:2025-05-10     浏览数:113     【 字体:

 通过基于 LLM 的动态航路点生成实现强大的移动机器人路径规划

作者链接 打开叠加面板
穆罕默德·塔哈·塔里克一个
,
亚西尔·侯赛因b
,
王聪庆 一个
 
显示更多
 
添加到 Mendeley
 
共享
 
引用
https://doi.org/10.1016/j.eswa.2025.127600
获取权利和内容
突出
提出了一个基于 LLM 的框架,用于复杂场景中的移动机器人路径规划。
与 DRL 模型不同,LLM 无需重新训练即可实现实时路径规划。
集成实时避障和重新规划,实现高效导航。
语音命令系统可实现动态航点的直观人机交互。
Llama3.1 与其他 LLM 模型相比性能更高。
抽象
复杂环境中的移动机器人路径规划仍然是实现高效、安全和稳健路径的重大挑战。在本文中,我们提出了一种新的框架,该框架嵌入了大型语言模型 (LLM),使移动机器人能够动态解释自然语言命令,从而自主生成高效且无碰撞的路径。我们的框架使用 LLM 将高级用户输入转换为可作的航点,同时动态调整路径以响应障碍物。我们在三个复杂性不断增加的环境中对所提出的框架进行了实验评估,表明我们使用 llama3.1 模型的方法的稳健性,在路径规划时间、航路点生成成功率和避免碰撞方面优于其他 LLM 模型。结果强调了 LLM 在增强移动机器人能力方面的有效性,尤其是当其作涉及大型复杂环境中的复杂决策时。我们的框架提供了更安全、更可靠的导航系统,并为未来的研究开辟了新的方向。这项工作的源代码在 GitHub 上公开提供1
介绍
包括 Open Ai、Gemini 和 Ollama 在内的大型语言模型 (LLM) 正在彻底改变移动机器人与人类交流并在复杂环境中规划其轨迹的方式(Shah et al., 2023, Sun et al., 2024)。LLM 理解自然语言命令的能力(Patki 等人,2020 年,Roy 等人,2019 年)和易于集成到实时决策中(Arkin 等人,2020 年,Barber 等人,2016 年)流程能力使它们特别适合路径规划,因为它们可以处理高级人类指令。在本节中,我们讨论了 LLM 在此类环境中的潜力,重点是围绕障碍进行实时重新规划。GPT-4(Achiam 等人,2023 年)、Gemini 1.5 Flash(Team 等人,2023 年)和 llama 3.2(Touvron 等人,2023 年)等现代 LLM 旨在理解自然语言,并可以接受命令根据用户提供的提示生成基于文本的输出(Guan 等人,2023 年,Huang 等人,2023 年,Kim 等人, 这些模型主要用于需要问答、网络安全(Alturkistani & Chuprat(2024)和语言翻译的任务。但在移动机器人的背景下,这些LLMs现在被用来解释人类的指令并将其转化为理想的任务,如生成机器人程序(Pu,Yang,Li,Guo,虚拟人(Llanes-Jurado,Gómez-Zaragozá,Minissi,Alcañiz和Marín-Morales,2024,故障检测(Baghernezhad,2012)和图像理解(Wang等人,2024。
在移动机器人路径规划中寻找 LLM 的最令人信服的原因之一是,尤其是在不同的环境条件下。尽管DRL模型是为任何给定的特定任务训练的(Hussain等人,2020年,Zhu和Zhang,2021年),并且通常针对起始和目标位置的特定配置进行训练,但这些模型只有在满足这些条件时才会表现良好(Biagiola & Tonella,2024)。另一方面,LLM 是在大规模数据集上预先训练的(Brown,2020),可以快速适应动态输入,而无需重新训练。鉴于 LLM 能够处理自然语言命令并且易于适应新的空间环境,当起点或目标对象可能经常变化时,LLM 为实时路径规划任务提供了非常灵活的解决方案。这一优势使基于 LLM 的路径规划非常适合需要灵活性、适应性和人机交互的环境。
LLM 能够理解自然语言中的高级命令,例如“Go to room X or Go to Window”,并将这些命令转换为移动机器人导航到所需对象的动作。LLM 理解这些命令并整合与环境有关的信息,然后它们可以为移动机器人生成一系列航点(Latif,2024 年),以便在环境中导航时到达所需的物体。根据完全基于 LLM 的移动机器人路径规划技术的研究现状,大多数环境是静态的(Kannan et al., 2023, Zeng et al., 2022),但实时重新规划(Song et al., 2023)对于推进该领域以应对在规划路径中出现任何意外障碍时避开障碍物的挑战变得至关重要。例如,以前或新生成的路径点序列在规划路径的道路上有一堵墙或一个对象。在这种情况下,为了避开障碍物并到达所需的位置,移动机器人需要一个实时重新规划机制,该机制可以生成新的航路点序列,以帮助重新规划障碍物周围的路径。本研究的主要重点是通过集成 LLM 来制造一种新颖的方法,从而在移动机器人路径规划领域做出有价值的补充(见图 1)。这种方法解决了不同的挑战,以提高性能、灵活性和复杂环境布局的稳健解决方案。以下是我们提议的方法的贡献:
我们开发了一种新颖的路径规划方法,该方法利用 LLM 来解释自然语言命令,以生成一系列航路点,帮助移动机器人到达目标对象。
我们实施了强大的实时避障和重新规划机制,机器人在导航时动态检测障碍物,并安全高效地重新规划其前往目标对象的路径。
我们集成了一个语音命令系统,该系统处理来自用户的自然语言命令并将其转换为导航航点,以增强人机交互。
凭借这些贡献,我们正在提供强大的解决方案,并为移动机器人提供实时适应性、人机交互、安全性、效率和复杂环境中的多功能性。从这项研究中获得的见解为探索先进的 AI 驱动路径规划移动机器人框架开辟了一条新途径。
[返回]
上一篇:模拟前三思:用于编排反事实问答神经计算的符号推理
下一篇:迈向准确的心理模拟:调查 LLM 对性格和文化变量的反应