| 一个用于自动植物表型的对话式多智能体人工智能系统 |
| 来源:一起赢论文网 日期:2026-04-06 浏览数:180 【 字体: 大 中 小 大 中 小 大 中 小 】 |
|
一个用于自动植物表型的对话式多智能体人工智能系统冯晨,伊利亚斯·斯托吉安尼迪斯,安德鲁·伍德,达尼洛·布埃诺,多米尼克·威廉姆斯,弗雷泽·麦克法兰,布鲁斯·D·格里夫,达伦·韦尔斯,乔纳森·A·阿特金森,马尔科姆·J·霍克斯福德,斯蒂芬·A·罗尔夫,特雷西·劳森,托尼·普里德莫尔,索提里奥斯·A·察夫塔里斯 & 马里奥·瓦莱里奥·朱弗里达 《自然通讯》,文章编号: (2026) 引用本文1891年访问指标details我们提供该手稿的未编辑版本,以便提前获取 发现。在最终出版前,手稿将进行进一步编辑。请注意 内容可能存在错误,且适用所有法律免责声明。摘要植物表型分析越来越依赖(半)自动化的基于图像的分析流程,以提高其准确性和可扩展性。然而,许多现有解决方案仍然过于复杂,难以重构和维护,且对缺乏丰富计算专业知识的用户来说构成了高障碍。为应对这些挑战,我们推出了PhenoAssistant:一套开创性的AI驱动系统,通过直观的自然语言交互简化植物表型分析。PhenoAssistant 利用大型语言模型,协调一个精心策划的工具包,支持包括自动表型提取、数据可视化和自动化模型训练等任务。我们通过多个代表性案例研究和一组评估任务验证了PhenoAssistant。通过降低技术障碍,PhenoAssistant强调了人工智能驱动方法论在推动植物生物学中人工智能普及化的潜力。类似内容被他人观看通过深度神经架构与可解释的人工智能,对植物病害进行稳健的诊断和元可视化文章 开放获取 2024年6月13日用自主机器人打破玉米表型领域瓶颈文章 开放获取 2025年3月21日用于细粒度表型分析的番茄多角度多姿态数据集文章 开放获取 2026年2月28日数据可用性案例研究1中使用的拟南芥数据已存放在Zenodo存储库[https://doi.org/10.5281/zenodo.18940282]76.用于训练和评估案例研究1中使用的计算机视觉模型的数据,已公开于CodaLab [https://codalab.lisn.upsaclay.fr/competitions/8970]的CVPPP2017叶片分割挑战数据集(A1和A4子集)。案例研究2中使用的土豆数据已公开存放于Zenodo库[https://doi.org/10.5281/zenodo.7938231]77.案例研究3中使用的冬小麦数据公开于CodaLab [https://codalab.lisn.upsaclay.fr/competitions/13833]的CVPPA@ICCV'23:冬小麦和冬黑麦营养缺乏图像分类数据集(WW2020子集)。本文附有来源数据。代码可用性这项研究的代码,以及聊天记录和案例研究和评估的生成输出,均可在Github [https://github.com/vios-s/PhenoAssistant/]78.参考文献Fiorani, F. 和 Schurr, U. 植物表型未来的情景。植物生物学年刊。 64,267–291(2013年)。谷歌学术 联合国。人口。https://www.un.org/en/global-issues/population。Lesk, C., Rowhani, P. 和 Ramankutty, N. 极端天气灾害对全球作物生产的影响。《自然》529卷,84–87页(2016年)。谷歌学术 Murphy, K. M., Ludwig, E., Gutierrez, J. 和 Gehan, M. A. 基于图像的植物表型分析中的深度学习。植物生物学年刊。 75, 771–795(2024年)。Coppens, F., Wuyts, N., Inzé, D. 和 Dhondt, S. 通过整合和数据驱动方法释放植物表型数据的潜力。柯尔。观点。系统生物学。 4,58–63页(2017年)。谷歌学术 Achiam, J. 等。GPT-4技术报告。预印本于 https://arxiv.org/abs/2303.08774 年(2024年)。Touvron, H. 等。LLaMA:开放且高效的基础语言模型。https://arxiv.org/abs/2302.13971 年(2023年)预印本。Shen, J., Tenenholtz, N., Hall, J. B., Alvarez-Melis, D. 和 Fusi, N. 标签大型语言模型:将通用大型语言模型重新利用用于专业领域。载于第41届国际机器学习会议论文集,第235卷,44759–44773(JMLR.org,2024年)。伊尔迪兹,O. 和 彼得卡,T.大型语言模型能说出科学工作流程吗?载于SC '25国际高性能计算、网络、存储与分析会议研讨会,2225–2233(计算机协会,2025年)。Sado, F., Loo, C. K., Liew, W. S., Kerzel, M. 和 Wermter, S. 可解释的目标驱动智能体与机器人——全面综述。ACM 计算。生存。 第55卷,1–41页(2023年)。谷歌学术 Acharya, D. B., Kuppan, K. 和 Divya, B. 智能人工智能:针对复杂目标的自主智能——一项综合综述。IEEE Access 13, 18912–18936(2025年)。谷歌学术 Sapkota, R., Roumeliotis, K. I. 和 Karkee, M. 人工智能代理与代理人工智能:概念分类法、应用与挑战。《融合基础》126卷,103599(2026年)。谷歌学术 Hughes, L. 等。人工智能智能体与智能系统:多专家分析。计算与基础设施系统学杂志 第65卷,1–29页(2025年)。谷歌学术 Borghoff, U. M., Bottoni, P. 和 Pareschi, R. 智能人工智能时代的人人工交互:一种系统理论方法。正面。嗡。Dyn。 第7卷,1579166年(2025年)。谷歌学术 M. 布兰等人。用化学工具增强大型语言模型。自然马赫智力。 6,525–535页(2024年)。谷歌学术 Boiko, D. A., MacKnight, R., Kline, B. 和 Gomes, G. 基于大型语言模型的自主化学研究。《自然》624, 570–578(2023年)。谷歌学术 Kang, Y. 和 Kim, J. ChatMOF:一种利用大型语言模型预测和生成金属有机框架的人工智能系统。自然公社。 15,4705(2024年)。谷歌学术 Ghafarollahi, A. 和 Buehler, M. J. 利用物理感知多模态多智能体人工智能自动化合金设计与发现。美国国家科学院院刊 122,e2414074122(2025年)。谷歌学术 Lei, W. 等人。Chatbot:一款由社区驱动的集成计算生物影像AI助手。自然方法学 21, 1368–1370(2024年)。谷歌学术 Royer, L. A. Omega——利用大型语言模型的力量进行生物图像分析。《自然方法》21卷,1371–1373页(2024年)。谷歌学术 图、T等人。迈向对话式诊断人工智能。《自然》642,442–450(2025年)。谷歌学术 Singhal, K. 等人。迈向专家级医疗问答,使用大型语言模型。自然医学院。 31, 943–950(2025年)。谷歌学术 戈特韦斯,J. 等人。关于一位人工智能共同科学家。预印本于 https://arxiv.org/abs/2502.18864 年(2025年)。杨、X.、高、J.、薛、W. 和 亚历山大松、E. PLLaMA:植物科学开源大型语言模型。预印本于 https://arxiv.org/abs/2401.01600 年(2024年)。Awais, M., Salem Abdulla Alharthi, A. H., Kumar, A., Cholakkal, H. 和 Anwer, R. M. AgroGPT:高效的农业视觉语言模型,专家调优。载于2025年IEEE/CVF计算机视觉应用冬季会议论文集(WACV) 5687–5696,https://doi.org/10.1109/WACV61041.2025.00555 (2025)。 杨、S. 等人。ShizishanGPT:一个整合工具和资源的农业大型语言模型。载于《国际网络信息系统工程会议论文集》,284–298页(施普林格,2024年)。张宇(Zhang, Y. 等)。IPM-AgriGPT:基于G-EA框架和农业情境推理的大型病虫害和疾病管理语言模型。数学 13, 566 (2025)。谷歌学术 Ravindran, D. J. S., Skarga-Bandurova, I., V, S., AWAIS, M. M. AgroLLM:通过大型语言模型连接农民与农业实践,以增强知识转移和实际应用。《农业工程》8卷,38页(2026年)。谷歌学术 阿尔沙德,M. A. 等人。利用视觉语言模型进行专业农业任务。载于2025年IEEE/CVF计算机视觉应用冬季会议论文集(WACV) 6320–6329,https://doi.org/10.1109/WACV61041.2025.00616(2025年 )。赵、X等人。实现大型语言模型和农业知识图谱,实现高效的植物病害检测。农业 14,1359(2024年)。谷歌学术 Roumeliotis, K. I., Sapkota, R., Karkee, M. 和 Tselikas, N. D. 结合编排者-代理信任的代理人工智能:一个模块化视觉分类框架,具备信任感知编排和基于rag的推理。IEEE Access 14, 26965–26982 (2026)。谷歌学术 Sapkota, R., Roumeliotis, K. I. 和 Karkee, M. 无人机遇见智能人工智能:自主空中情报与智能无人机的多域调查。预印本于 https://arxiv.org/abs/2506.08045 年(2025年)。Benegas, G., Batra, S. 和 Song, Y. S. DNA语言模型是全基因组变异效应的有力预测因子。美国国家科学院院刊 120,e2311219120(2023年)。谷歌学术 门多萨-雷维拉,J. 等。一个可食用植物基因组的基础大型语言模型。Commun. Biol. 7,835(2024年)。谷歌学术 张,R. 等人。PlantGPT:基于拟南芥的智能智能体,能够解答关于植物功能基因组学的问题。高级科学。 12,e03926(2025年)。谷歌学术 团队,G. 等人。Gemini:一系列高性能多模态模型。预印本,https://doi.org/10.48550/arXiv.2312.11805 年(2025年)。Liu, H., Li, C., Wu, Q. 和 Lee, Y. J. 视觉教学调谐。高级神经基础设施。系统。 36, 34892–34916(2023年)。谷歌学术 Minervini, M., Giuffrida, M. V., Perata, P. 和 Tsaftaris, S. A. Phenotiki:一个开放软硬件平台,用于经济实惠且简便的玫瑰形植物基于图像的表型分析。植物J。 90,204–216(2017年)。谷歌学术 Williams, D., Macfarlane, F. 和 Britten, A. 仅限叶片 SAM:用于零射自动叶片分割的分段任意流程。Smart农业。Technol。 8,100515(2024年)。谷歌学术 胡、E. J. 等。Lora:大型语言模型的低秩适配。载于《国际学习表征会议论文集》(OpenReview.net,2022年)。Yi, J. 等人。利用RGB图像进行甜菜营养缺乏的非侵入性诊断深度学习。《传感器》20,5893(2020年)。谷歌学术 Yi, J. 等人。利用无人机RGB图像非侵入性诊断冬小麦和冬黑麦的营养缺乏。计算。电子。农业。 第239页,110865(2025年)。谷歌学术 DeepSeek-AI 等人。DeepSeek LLM:以长期视角扩展开源语言模型。预印本于 https://doi.org/10.48550/arXiv.2401.02954 年(2024年)。郭大等人。DeepSeek-R1 通过强化学习激励大型语言模型中的推理。《自然》645, 633–638(2025年)。谷歌学术 顾志等人。关于LLM作为评判的调查。创新101253 https://doi.org/10.48550/arXiv.2411.15594(2026年)。戈莱查,S. 和 加里加-阿隆索,A.《Among Us》:一个用于测量和检测代理欺骗的沙盒。发表于第39届神经信息处理系统年会(NeurIPS,2025)论文集。Sapkota, R., Roumeliotis, K. I. 和 Karkee, M. Vibe编码与代理编码:代理AI的基本原理及其实际意义。预印本,https://arxiv.org/abs/2505.19443 年(2025年)。艾弗利,R. 和赵,W.-L.统一的分布外检测:模型特定视角。载于2023年IEEE/CVF国际计算机视觉会议论文集(ICCV)1453–1463,https://doi.org/10.1109/ICCV51070.2023.00140(2023年)。 宫井A. 等人。视觉语言模型时代的广义分布外检测及其后:一项调查。《机器学习研究汇刊》https://openreview.net/forum?id=FO3IA4lUEY(2025年)。Tonmoy, M. R., Hossain, M. M., Dey, N. & Mridha, M. MobilePlantViT: a mobile-friendly hybrid ViT for generalized plant disease image classification. Preprint at https://arxiv.org/abs/2503.16628 (2025).Han, B. et al. FoMo4Wheat: toward reliable crop vision foundation models with globally curated data. Preprint at https://doi.org/10.48550/arXiv.2509.06907 (2025).Hugging Face. Hugging Face–The AI community building the future https://huggingface.co/.卡格尔。Kaggle:您的机器学习与数据科学社区 https://www.kaggle.com/。模型情境协议。什么是模型上下文协议(MCP)?https://modelcontextprotocol.io/docs/getting-started/intro。Geerling, W., Mateer, G. D., Wooten, J. 和 Damodaran, N. ChatGPT 在大学经济学中的理解考验中表现出色:接下来呢?美国经济学。 68,233–245页(2023年)。谷歌学术 陈宇、刘鼎、梁伟、山宇 和 钟祥。GPT经济理性的出现。美国国家科学院院报 120,e2316205120(2023年)。谷歌学术 Shah, D., Osiński, B., Ichter, B. 和 Levine, S. LM-Nav:具有大型预训练语言、视觉和动作模型的机器人导航。载于第六届机器人学习会议论文集,492–504(PMLR,2023年)。崔C.、马、Y.、曹X、叶、W. 和王Z。《边说边说:实现自动驾驶车辆中与大型语言模型的类人交互》。收录于2024年IEEE/CVF计算机视觉应用冬季会议论文集(WACVW)902–909,https://doi.org/10.1109/WACVW60836.2024.00101(2024年)。 高智等。大型语言模型赋能基于主体的建模与仿真:综述与视角。人文科学社团。 11, 1259(2024年)。谷歌学术 Han, K., Kuang, K., Zhao, Z., Ye, J. 和 Wu, F. 基于大型语言模型的因果代理。预印本于 https://arxiv.org/abs/2408.06849 年(2024年)。王、X等人。因果副驾驶:一种自主因果分析代理。预印本于 https://arxiv.org/abs/2504.13263 年(2025年)。Chi, H. 等人。揭示大型语言模型中的因果推理:现实还是海市蜃楼?高级神经基础设施。系统。 37, 96640–96670(2024年)。谷歌学术 钱C等。ChatDev:用于软件开发的沟通代理。载于计算语言学协会第62届年会论文集(第1卷:长篇论文)(编者:Ku, L.-W., Martins, A. 和 Srikumar, V.) 15174–15186(计算语言学协会,2024年)。杨、Y等人。AgentNet:基于LLM的多智能体系统的去中心化进化协调。发表于第39届神经信息处理系统年会(NeurIPS,2025)论文集。吴启 等。AutoGen:通过多智能体对话实现下一代LLM应用。在程序中。首届语言建模会议(OpenReview.net,2024年)。CrewAI。CrewAI:领先的多智能体平台 https://www.crewai.com/。李、H. 等人。通过多智能体强化学习推进角色差异化的协作辩论。载于计算语言学协会第63届年会会议论文集(第1卷:长篇论文)(编者Che, W., Nabende, J., Shutova, E. 和 Pilehvar, M. T.) 22655–22666(计算语言学协会,2025年)。Lu, S., Shao, J., Luo, B. 和 Lin, T. MorphAgent:通过自我演化的配置文件和去中心化协作赋能智能体。预印本,https://doi.org/10.48550/arXiv.2410.15048 年(2025年)。Raza, S., Sapkota, R., Karkee, M. 和 Emmanouilidis, C. 《TRiSM for agentic AI:基于LLM的代理多智能体系统中的信任、风险与安全管理综述》。《人工智能开放》7卷,71–95页(2026年)。谷歌学术 谷歌云。宣布Agent2Agent协议(A2A)https://developers.googleblog.com/en/a2a-a-new-era-of-agent-interoperability/。Cheng, B., Misra, I., Schwing, A. G., Kirillov, A. 和 Girdhar, R. 用于通用图像分割的掩蔽注意掩膜变换器。载于2022年IEEE/CVF计算机视觉与模式识别会议论文集(CVPR)1280–1289,https://doi.org/10.1109/CVPR52688.2022.00135(2022年 )。Chen, F., Tsaftaris, S. A. 和 Giuffrida, M. V. GMT:用于叶片实例分割的引导掩膜变换器。载于2025年IEEE/CVF计算机视觉应用冬季会议论文集(WACV)1217–1226,https://doi.org/10.1109/WACV61041.2025.00126(2025年 )。Minervini, M., Fischbach, A., Scharr, H. 和 Tsaftaris, S. A. 基于图像的植物表型细粒注释数据集。模式识别。Lett。 81,80–89(2016年)。谷歌学术 陈,F.,朱弗里达,M. V. 和 察夫塔里斯,S. A. 适应视觉基础模型进行植物表型分析。载于2023年IEEE/CVF国际计算机视觉研讨会会议论文集(ICCVW) 604–613,https://doi.org/10.1109/ICCVW60793.2023.00067 (2023)。 Oquab, M. 等。DINOv2:无监督学习强健视觉特征。《机器学习研究汇刊》https://openreview.net/forum?id=a68SUt6zFt(2024年)。Chen, F., Tsaftaris, S. A. 和 Giuffrida, M. V. 阿拉伯芥用于自动植物表型分型的对话式多智能体人工智能系统数据 [数据集]。https://doi.org/10.5281/zenodo.18940283(2026年)。Williams, D., Macfarlane, F. 和 Britten, A. 土豆叶片数据集 [数据集]。https://doi.org/10.5281/zenodo.7938231(2023)。Chen, F. vios-s/PhenoAssistant:PhenoAssistant-nc-release(nc-release)。https://doi.org/10.5281/zenodo.18334981(2026年 |
| [返回] |