欢迎访问一起赢论文辅导网
本站动态
联系我们
 
 
 
 
 
 
 
 
 
 
 
QQ:3949358033
微信:paperwinner
工作时间:9:00-24:00
EI期刊论文
当前位置:首页 > EI期刊论文
柑橘农业数字孪生模型展示了个性化农业的潜力
来源:一起赢论文网     日期:2024-09-06     浏览数:307     【 字体:

 柑橘农业数字孪生模型展示了个性化农业的潜力

 
数字孪生是一种数字表示,它通过结合跨学科知识和先进技术,与现实世界的物体非常相似或复制。数字孪生已应用于各个领域,包括农业领域。鉴于大数据和系统化数据管理,数字孪生可用于预测未来结果。在这项研究中,我们努力使用柑橘作为模型作物创建一个农业数字孪生。我们采用 Open API 来汇总来自济州岛各种来源的数据,覆盖面积约为 185,000 公顷。收集的数据在区域、果园间和果园内尺度上进行可视化和分析。我们观察到,果园内分析比果园间分析更能解释水果质量的变化。我们的数据可视化和分析,结合统计模型和机器学习算法,展示了农业数字孪生在未来的潜在用途,特别是在微精确和个性化农业的背景下。这一概念扩展了当前基于数据驱动决策的管理实践,并通过实现植物的定制治疗,类似于人类的个性化医学,让我们得以一窥个体化农业的未来。
 
其他人正在查看类似内容
 
负责任的农业人工智能需要系统地了解风险和外部性
报道 2022-02-23
 
埃塞俄比亚小麦景观的转变:通过 DNA 指纹图谱追踪品种的使用情况
文章 开放获取 28 十月 2020
 
数字再生农业
文章 开放获取 26 三月 2024
介绍
由于数字孪生 (DT) 的概念是由 Grieves M 提出的1,它已被引入各个领域,包括航空航天、汽车、制造、建筑、房地产、健康、医学和农业2,3,4,5,6.尽管 DT 在各个领域都有广泛的含义,但它通常被定义为在数字环境中实现现实世界物理系统的虚拟对应物。它通常允许用户模拟、建模和分析数据以做出明智的决策7.DT 依赖于最先进的技术的集成,包括信息和通信技术 (ICT)、物联网 (IoT)、遥感、地理信息系统 (GIS)、大数据分析和人工智能 (AI)8,9.ICT 提供了从物联网设备和遥感获取、聚合、存储和分析数据所需的基础设施和通信网络,因此农民可以访问和使用数字平台进行精准农业和作物管理。传感器等无线物联网设备收集农业数据,包括天气状况、土壤湿度和作物生理信息10.此外,无人机和卫星(遥感)生成的数字图像导致农民和研究人员的范式转变,从异质田地的同质管理方法转变为异质田地(土壤肥力、土壤水分、植物病原体等)的异质管理方法。11.为了实现这种范式转变,农业数据应与纵向数据和地理空间数据相结合进行管理,以便在正确的时间和地点实施农业实践。特别是,地理空间数据使农民能够根据作物需求在精确的特定地点基础上施用投入材料12.鉴于大数据和系统化数据管理,机器学习和深度学习算法等 AI 可用于预测和数据驱动的决策。结果为农民提供了见解,以改进决策,并根据每个植物生长阶段的需要为农田中的每平方米提供所需的投入资源(水、肥料、杀虫剂等)11、13、14 元.
 
使用上述先进技术进行了大量农业数字化的研究6,8,9,11,15.Jayaraman 等人提出了一个基于物联网的平台 SmartFarmNet,它可以自动收集有关环境、土壤条件、施肥和灌溉的数据10.此外,它可以集成来自其他来源的数据,所有数据都可以存储在云服务器上,以分析结果并将其呈现给 API 用户。Teschner 等人表明,基于无人机的入侵检测 DT 可有效保护农田16.在这项研究中,所有数据都分布在 5 G 通信网络上。Moghadam 等人在果园规模上发起了 DT17.具体来说,他们创建了一个使用 3D LiDAR 摄像头扫描每棵树状态的系统。该果园 DT 能够持续监测树木的健康状况、结构和果实质量,并预测树木的胁迫水平、疾病的存在和产量损失。给定所有信息,DT 根据环境和管理参数模拟各种场景17.Delgado 等人提出了一个 WebGIS 框架,该框架收集地理空间数据并汇总到农业的区域和全球视图中,以支持农民和农业政策制定者的大数据分析11.Verdouw & Kruize首次报告了六次使用FIWARE开源平台开发农业DT的案例。18.FIWARE 可轻松连接 IoT 传感器并提供云服务和开放式 API,以实现实时数据处理和大数据分析。作为使用深度学习算法进行作物管理的一个例子,Anagnostis 等人提出了一种使用基于 U-net 算法(一种卷积神经网络变体)的航空图像进行果园树木分割的方法19.该模型被证明可以有效地检测和定位树冠,性能水平高达 99%。江 et al. 使用基于机器学习的 DT 方法预测了研究区域的森林变化趋势20.该 DT 基于来自 Landsat 7 卫星的遥感影像,用于调查林业冠层、物种和分布演替。在收获后管理方面,Tagliavini 等人提出了一种可以管理收获芒果质量的 DT21.在这种情况下,在整个冷链中,计算流体动力学用于评估质量损失,例如水果硬度、总可溶性固形物、酸度和维生素含量。因此,DT 的应用已经变得复杂和多样化。
 
韩国制定了一项智能农场研究政策,以推进智能农场研究,从室内温室到开阔田地。作为其中的一部分,我们的研究团队旨在开发一种用于管理露地柑橘 (Citrus unshiu) 果园的 DT。水果作物通过无性繁殖(嫁接)繁殖,导致每棵树都具有相同的基因组。此外,由于水果作物是多年生作物,因此可以每年更新来自同一个体的数据,从而进行时空分析。与其他作物不同,水果作物需要每个个体有足够的空间,这有助于收集特定于个体的数据。
 
不幸的是,不可预见的研究政策变化和预算削减停止了所有露天智能农场研究项目。因此,我们无法继续与参与柑橘种植的数据生产者合作。作为替代对象,我们汇总并集中了独立于不同来源的数据(图 D)。1). 根据《促进公共数据的提供和使用法》22,韩国政府发布了大量由各种国家和公共机构生成的数据集,这些公共信息被称为开放数据。每个公共机构都可以直接提供自己生成和获取的开放数据,也可以通过开放数据门户 (https://www.data.go.kr) 提供开放数据,这是一个可以在一个站点存储和提供所有开放数据的集成档案。农村发展管理局 (RDA) 每年根据土地利用类型调查土壤化学特性,并向农民提供信息以进行田间施肥。利用这些信息,农民可以以低成本为农作物提供适量的肥料,并通过消除肥料滥用和防止土壤渗漏为环境保护做出贡献。济州岛位于朝鲜半岛的最低纬度,岛中央有一座休眠火山,盛产柑橘。济州自由国际城市发展中心 (JDC) 收集了有关水果糖含量和大小、天气信息和柑橘园农业实践的数据。JDC 在 2021 年调查了 30 个随机选择的果园,并通过数据门户提供了信息。根据内政和安全部 (MOIS) 发布的区域代码和地址信息,通过 Kakao Developers 服务器对数据进行地理编码。为了在地图上可视化地理编码数据,从国家空间数据基础设施门户 (NSDIP) 下载 GIS 地图文件。所有开放数据都通过 Open API 分发,并且可以自由轻松地访问23.
 
图 1:示意图说明了通过农业数字孪生进行数据收集、分析和决策支持的过程。
图 1
通过 Open API 从各种来源收集的独立数据将与空间信息合并并进行地理编码。合并的数据可以显示在 GIS 地图上,并使用各种统计方法和机器学习算法进行分析。分析的数据支持区域规模、果园间或果园内分析,根据利益相关者的观点提供定制信息。通过此过程,利益相关者可以获得对区域或果园级别决策的支持,并且他们可以在果园内的树级别获得自定义信息。因此,未来的农业系统有可能从精准农业发展到个性化农业。在济州岛地图上,灰色圆点表示所有已识别果园的位置,紫色圆点表示本文中选定的果园。缩写如下:MOIS,内政和安全部;RDA,农村发展管理局;JDC,济州自由国际城发展中心;NSDIP,国家空间数据基础设施门户。源数据作为 源数据 文件提供。
 
全尺寸图像
本研究的目的是展示农业 DT 支持数据监控和数据驱动决策的可行性。我们选择柑橘作为本研究的模式作物,因为它在济州岛广泛种植且多年生性质。我们判断,这种可持续的条件对于 DT 未来的长期成功是必要的。本文说明,通过整合从不同来源获得的多个数据集(利用开放 API)并创建用于柑橘园管理的 DT,我们不仅可以实现精准农业,还可以实现个性化农业,其中每棵果树都单独管理。可用的数据集包含各种信息,包括土壤化学特性、水果质量、天气数据和农业实践;它们在区域、果园间和果园内尺度上进行分析;并创建了一个交互式小程序 R Shiny,以演示农业 DT 如何为政策制定者、研究人员、分销商和农民提供数据驱动的决策支持。在区域、果园间和果园内层面进行监测非常重要,特别是,定期监测单棵树的果实质量对于成功的个性化农业至关重要,而 DT 可以通过使监测准确和高效来增加价值。
 
结果
区域尺度分析
空间信息和观察到的土壤成分如图 1 所示。2 使用核密度估计 (KDE)。土壤成分包括可用的磷酸盐、可交换的阳离子(Exch. K、Ca 和 Mg)、酸度 (pH)、有机物和电导率。图中使用了从蓝色(低值)到黄色(高值)的色阶。此可视化说明了在济州岛观察到的位置和土壤条件,不包括 KDE 分析中的其他可用信息,例如稻田和温室土壤。与东部地区相比,该岛西部地区的有效磷酸盐、外部钾和镁的水平、pH 值和电导率往往更高,与外部钙和有机物形成鲜明对比。根据 JARES 报告24,济州岛西部是非火山灰土壤区,类似于朝鲜半岛的陆地土壤,生产力很高。另一方面,东部是火山灰土壤,其特点是有机质和有效磷酸盐含量低,外含钙含量高。这些土壤特性可能是西部地区(非火山灰土壤区)果园有效磷酸盐含量高的原因(图 D)。相对于西部地区,东部地区观察到的可用磷酸盐水平接近 200-300 mg kg−1这是 RDA 推荐的范围。由于火山灰土壤的区域特性,东部地区的农民似乎施用了大量有机肥料来解决有机质含量低的问题。因此,东部地区观察到的有机物水平高于 110-150 克公斤的推荐水平−1(图 .如果这些模式得到持续观察和确认,政策制定者或地方政府农业官员可能会规划济州岛有机肥料的供需情况,并准备替代方案来解决区域失衡问题。此外,由于土壤 pH 值较高,西部地区更易呈碱性,政策制定者需要鼓励向西部地区的果园供应降低 pH 值的石灰基肥料。目前,土壤数据收集的频率不规则,土壤数据相对稀缺(大约每年一次)。需要更频繁地收集数据,以增加有关区域土壤条件和与柑橘果实质量的区域关系的知识。
 
图 2:济州岛柑园土壤化学性质的核密度估算图。
图 2
A:有效磷酸盐 (Av. P2O4)、B:可交换钾 (Exch. K)、C:可交换钙 (Exch. Ca)、D:可交换镁 (Exch. Mg)、E:土壤酸度 (pH)、F:有机质 (OM) 和 G:电导率 (EC)。所选柑橘园附近每种土壤化学成分的估计水平由每个面板中从蓝色(低值)到黄色(高值)的颜色渐变表示。源数据作为 源数据 文件提供。
 
全尺寸图像
预期的果实大小和糖含量可能取决于地区和收获时间。特定于时间和位置的估计值如图 1 所示。3. 每个数据点的大小与估计的平均果实大小成正比,糖含量水平用颜色编码。颜色较深(棕色)表示糖分水平高 (>11.5° Brix)。10 月下旬,平均糖分水平高于 11.5 白利糖度的情况并不常见,但在 11 月中旬和下旬更为常见。11 月下旬,位于南部地区(纬度低于 33.4°N)的果园观察到的糖分水平高于北部地区的果园。时间和地点似乎分别是影响糖含量和果实大小的信息层。
 
图 3:济州岛柑橘园的糖含量和果实大小的时空变化。
图 3
果园和时间(从 10 月的第 4 至 5 周到 11 月的第 3 至 4 周)的含糖量和果实大小的变化由圆圈类型(开放和封闭)和大小表示。借助数字孪生,可以通过特定位置和时间来解释水果质量数据。该图代表了济州自由国际城市发展中心调查的 30 个柑橘园中的 27 个精选柑橘园。源数据作为 源数据 文件提供。
 
全尺寸图像
合并后的数据集显示,糖含量与一些土壤(外部钾、镁、pH 值和电导率)和天气相关变量(温度和湿度)呈单调关系,与可用磷酸盐、外部钙、有机质和气压呈非单调关系。在 RDA 建议的可用磷酸盐和有机物范围附近观察到相对较高的糖含量,而不是大果实大小(图 D)。4A, F) 的相比之下,Exch. Ca 与果实大小的关系比与糖含量的关系更强(图 C)。这一观察结果表明,为了避免果实过大,应抑制钙肥的过度施用。当气压在 0 到 5 个大气压之间时,糖含量趋于增加,而果实大小趋于减小。当气压高于 6 个大气压时,观察到相反的趋势(图 D)。糖含量和果实大小之间的反比关系也出现在有效磷酸盐、外钙和有机物的推荐范围内。然而,如上所述,如果糖含量和果实大小的变化主要受土壤和天气因素的影响,那么农民就不可能通过改变气压来人为地控制这些因素。
 
图 4:糖含量和果实大小与土壤化学性质和天气相关条件的平均趋势。
图 4
A:有效磷酸盐 (Av. P2O4)、B:可交换钾(Exch. K)、C:可交换钙(Exch. Ca)、D:可交换镁(Exch. Mg)、E:土壤酸度(pH)、F:有机质(OM)、G:电导率(EC)H:温度、I:湿度和 J:气压。灰色框代表农村发展管理局推荐的柑橘园土壤每种成分的适当范围。源数据作为 源数据 文件提供。
 
全尺寸图像
场间分析
农业实践的频率和时间因果园而异。大多数果园(30 个果园中的 27 个)记录并提供了有关农业实践的信息,包括修剪、施肥、喷洒、覆盖和疏伐。修剪是选择性地去除植物部分(如树枝或茎)的过程,目的是促进植物生长、增加果实产量和提高整体果实质量25.修剪在实现高质量水果生产和保持一致的果实大小方面起着至关重要的作用26.此外,它还刺激水果中的糖含量。最佳施肥通过影响果实的重量和质量来提高果实产量27.喷洒可以帮助控制可能伤害树木和降低水果质量的病虫害。覆盖物用于保持土壤水分和抑制促进植物生长的杂草竞争。间伐是水果生产中一种重要的农业实践,用于减少每棵树的果实数量并改善果实大小28.虽然已知每种农业实践都是有益的,但观察到的施用频率和时间因果园而异。补充图图 1 显示了一个山脊图,显示了所有果园每月进行的农业实践的频率。喷洒从 3 月开始,通常在 4 月至 9 月之间进行,这种信息使研究人员能够调查目标流行的病原体或害虫。水果疏果发生在 4 月至 9 月之间,大多数农民在 7 月或 8 月进行。农民通常对覆盖时间(通常在 6 月或 7 月)和修剪时间(通常在 3 月)做出类似的决定。然而,施肥时间显示出高度可变性,从 2 月到 7 月不等,一些农民甚至在 1 月和 10 月施肥。如果这种关于农业实践的信息随着时间的推移而可用,并且与水果质量相关,它将有助于规划和运营决策。这样的系统对没有经验的农民或刚到该地区的农民特别有益。
 
出于营销目的,水果质量根据糖含量和果实大小这两个主要因素进行分类。柑橘水果的糖分含量通常超过 10° Brix 才能出售。鉴于此条件,根据果实大小确定质量等级如下:太小 (<49 mm)、2 S (49-54)、S (54-59)、M (59-63)、L (63-67)、2 L (67-71) 和太大 (>71)。太小或太大的水果被认为滞销,而其他类别的水果则适合上市。归类为 S 或 M 的水果被评为优质,表示质量最高,归类为 2 S、L 或 2 L 的水果被评为质量一般。比较了西部地区的 Hab 和东部地区的 Iab 这两个果园的果实品质和土壤化学性质,这两个果园种植了名为 Miyagawa Wase 的相同品种。比较揭示了土壤化学性质的显著差异,这可能与水果品质的变化有关(图 D)。5 和表 1)。图 1 中的灰色框5A 代表 RDA 推荐的施肥标准29.由于东部地区发现的火山灰土壤的特性,Iab 果园的有效磷酸盐含量较低,而 Exch. Ca 含量较高。由于政府旨在增加有机肥料供应的政策,大多数果园的有机质水平都足够。然而,与 Iab 果园不同的是,Hab 果园具有高水平的导电性,这表明土壤中养分过多,会对柑树吸收养分产生负面影响。Iab 果园在比 Hab 果园晚几个月进行农业实践,但修剪除外(图 D)。Iab 的含糖量较高,除 10 月下旬外,Iab 的果实较大,但 11 月初除外(图 D)。5C),与 Hab.两个果园的水果糖含量都超过了 10° Brix 的上市标准。然而,如果这种模式每年持续,建议从 10 月的第三周到 11 月的第一周收获 Iab 果园,从 11 月的第一周到 11 月的第四周收获 Hab 果园(图 D)。5D) 以获得优质水果 (54-63 mm)。
 
图 5:Hab (位于东部地区) 和 Iab (西部地区) 两个果园之间的果园间分析。
图 5
将两个果园的土壤化学特性与农村发展管理局 (A) 推荐的施肥标准(灰框)进行比较。比较两个果园之间每种农业实践的每月频率,以及每个果园每月进行的农业实践次数的比较 (B)。小提琴图比较了两个果园的糖含量和果实大小随时间的分布;N = Hab 在 10 年中期、10 年末和 11 月初的 300 个柑橘; Iab 在 10 中期和 10 后期 300 和 N = 600 在 11 年初。用于糖含量 (°Bx) 的箱线图(最小值、第一四分位数、中位数、第三个四分位数和最大值)的 5 个数字摘要在 10 月中期为 (7.7, 9.5, 10.5, 11.4, 14.2),在 10 月后期为 (6.8, 10.3, 11.2, 12.1, 13.9),对于 Hab,在 11 月初为 (8.8, 10.2, 11.3, 12.5, 15.0);和 (7.2, 10.3, 11.7, 12.9, 16.3) 在 10 年中期,(8.2, 10.1, 10.9, 11.6, 14.4) 在 10 年后期,以及 (8.8, 11.6, 12.2, 12.8, 15.5) 在 11 年初。果实大小 (mm) 的 5 个数字汇总为 (40.6, 43.2, 45.8, 48.8, 51.4) 在 10 年中期,(40.6, 43.3, 46.1, 48.7, 51.4) 在 10 年后期,以及 (47.9, 52.4, 56.7, 61.3, 65.5) 在 11 月早期;Iab (C) 在 10 年中期为 (44.9, 53.2, 61.6, 67.8, 75.8),10 月后期为 (47.1, 49.9, 53.2, 56.3, 59.4),11 月初为 (40.1, 41.9, 45.4, 53.1, 58.7)。条形图显示了随时间推移对滞销、可售和优质等级的比例进行了比较;哈布果园 10-3、10-5、11-1 和 11-2 中 N = 300 个柑橘,11-3 和 11-4 中 N = 288 个柑橘;N = Iab 果园 (D) 的 10-3、10-4、11-1 和 11-2 的 300 个柑橘。源数据作为 源数据 文件提供。
 
全尺寸图像
表 1 济州岛 Hab 和 Iab 果园的比较
全尺寸表格
两个果园之间观察到果实成熟度和质量的显著差异,即使它们种植相同的品种,表明相同的基因型。如前所述,这些差异可归因于不同的环境因素以及农业实践和管理的差异。同样,在同一果园内观察到糖含量和果实大小的显着变化(图 D)。5C),尽管生长相同的基因型。这些较小尺度的变化可能受到微环境因素的影响。这清楚地强调了在果园内收集微观环境数据的重要性。这些数据将为研究人员提供有关环境×管理互动的信息,并为农民和分销商提供利润。他们可以在最佳时间从每个果园出售和购买优质水果,以实现利润最大化。
 
果园的含糖量和果实大小趋势不同。果园间果实大小的差异(中位大小为 43.9 至 67.6 毫米)明显大于果园间糖含量的变化,后者为 9.8 至 12.1 °Brix(图 D)。6). 与糖含量不同,果实中位值最低 (Xab) 的果园和中位果值最大的果园 (Uab) 明显可区分(图 D)。Xab 果园生产的水果含糖量相对较高,而 Uab 果园生产的水果含糖量相对较低(图 D)。6A)。如前所述,在区域尺度分析中(图 .4)、柑橘果实的含糖量和果实大小似乎成反比。为此,采收时间的确定对于平衡两个柑橘品质因素非常重要,最终提高优质水果的比例。
 
图 6:果园的糖含量和果实大小的分布。
图 6
A: 含糖量, B: 果实大小。在 10 月中旬(10 月的第三周)和 11 月下旬(11 月的第四周)期间,在 27 个果园中观察到的 N = 39,679 个水果中,果园按糖含量中位数 (A) 和果实大小中位数 (B) 排序。Nab 果园的中位糖含量 (°Bx) 最低,其箱线图(最小值、第一四分位数、中位数、第三四分位数和最大值)的 5 个数字汇总为 (6.6, 9.1, 9.8, 10.6, 14.1)。Cbb 果园的糖分中位数最高,其箱线图的 5 个数字汇总为 (8.2, 11.3, 12.1, 12.9, 15.3)。Xab 果园的中位数大小 (mm) 最小,其箱线图的 5 个数字汇总为 (40.3, 42.3, 43.9, 46.3, 54.5)。Uab 果园的中位尺寸 (mm) 最大,其箱线图的 5 个数字汇总为 (55.9, 63.7, 67.6, 71.8, 80.4),其中观察到的最小尺寸 Uab (55.9 mm) 大于观察到的最大尺寸 Xab (40.3 mm)。源数据作为 源数据 文件提供。
 
全尺寸图像
此外,大多数果园的含糖量趋势随着时间的推移而增加,而果园的果实大小的趋势并不一致(补充图 D)。2). 从 10 月的第三周开始,柑橘果实同时收获,恰逢水果质量调查的开始。混合效应模型估计,平均糖含量随着时间的推移持续增加,基本上不受持续收获的影响,并且平均糖含量的持续增加非常显著 (p < 0.001)。与第一周,即 10 月的第三周(用 10-3 表示)相比,10-4、10-5、11-1、11-2、11-3 和 11-4 的估计平均糖含量分别高出 0.309、0.308、0.658、1.047、1.248 和 1.435 °Brix。该模型估计,平均果实大小在最初一周后减小,但模式不如平均含糖量那么明显。有关混合效应模型下的估计参数,请参见补充表 1。在我们的研究数据中,时间因素仅限于土壤、天气和农业实践。当种植同一品种时,果园之间果实质量纵向趋势的变化可归因于不同的环境和管理。
 
由 R 中的“h2o”包实现的自动机器学习 (AutoML) 算法30,当使用果实观察时间和果园层面的变量(包括五种农业做法(施肥、覆盖、修剪、喷洒和疏果)和三个天气变量(温度、湿度、气压))进行分析时,预测果实大小优于糖含量。所选模型是堆叠集成模型,其结果为均方根误差 (RMSE) = 0.97,平均绝对误差 (MAE) = 0.76,R 方 (R2) = 0.43 糖含量,RMSE = 3.73,MAE = 2.96,R 2= 0.84 的果实大小。果园指数被确定为最重要的预测因子,其次是糖含量和果实大小的气压。在果园层面,对果实大小的预测比对糖含量的预测要好得多(图 D)。7),这意味着可能需要果园内分析,特别是为了改进糖含量预测。
 
图 7:使用基于天气和水果质量数据的机器学习模型预测和观察到的糖含量和果实大小的散点图。
图 7
A: 含糖量, B: 果实大小。源数据作为 源数据 文件提供。
 
全尺寸图像
场内分析
在果园内观察到果实质量的显著差异。除了果园之间的差异外,了解果园内水果质量的可变性(称为果园内差异)也很重要。为了便于说明,图 1 中选择了 Iab 果园。8. 在数据集中,水果样本根据它们离地面的高度分为高、中、低位置,每周从每棵树的每个位置收集三个样本。糖含量和果实大小的分布在三个位置水平上似乎非常相似(图 D)。8A)。
 
图 8:Iab 果园的果园内分析。
图 8
糖含量和果实大小的分布通过果实在树上的位置与时间的关系进行比较;每棵树 3 个柑橘(每个位置一个)和 100 棵树。这三个位置的分布相似,但在时间方面不同。结合所有位置,含糖量 (°Bx) 的箱线图(最小值、第一四分位数、中位数、第三个四分位数和最大值)的 5 个数字摘要在 10-3 中为 (7.2, 10.3, 11.7, 12.9, 16.3),在 10-4 中为 (82, 10.1, 10.9, 11.6, 14.4),在 11-1 中为 (8.9, 10.7, 11.8, 12.3, 15.1),在 11-2 中为 (8.8, 12.2, 12.6, 13.0, 15.5);果实大小 (mm) 的 5 个数字汇总为 10-3 中的 (44.9, 53.2, 61.6, 67.8, 75.8),10-4 中的 (47.1, 49.9, 53.2, 56.3, 59.4),11-1 中的 (46.9, 50.0, 53.1, 55.8, 58.7) 和 11-2 (A) 中的 (40.1, 41.1, 41.9, 43.1, 43.9)。糖含量和果实大小的分层聚类分析(100 棵树的纵向观察)使用 4 个聚类 (B) 显示。源数据作为 源数据 文件提供。
 
全尺寸图像
当使用混合效应模型进行分析时,基于位置的预期糖含量存在差异,但平均糖含量的估计差异很小。高位水果的含糖量平均仅比中间位的水果高 0.020 °Brix (p = 0.131),中间位置的水果含糖量比低位的水果平均高 0.039 °Brix (p = 0.000251)。然而,三个位置之间的果实大小没有统计学上的显著差异。因此,根据水果的位置对水果进行分级似乎没有什么实际意义。有关混合效应模型下的估计参数,请参见补充表 2。
 
分层聚类分析根据观察到的糖含量和果实大小随时间变化的趋势,将 Iab 果园中的单棵树分为四个集群(图 D)。8). 其中一个集群(图 2 中的集群 2)。8A) 清楚地显示调查期间糖含量呈上升趋势,而其他三个集群则没有。另一方面,所有四个聚类都显示出果实大小的减小趋势(图 D)。随着时间的推移,树木之间的糖含量存在很大差异,这表明即使在同一果园种植相同的品种,特定的管理实践也可能提高糖含量。例如,在通过分层聚类分析确定一组结出低糖分果实的树木后(图 3 中的集群 3)。8A),可以将定制的农业实践应用于每棵选定的树木,以提高其糖含量。这些组在 10 月的第三周,即调查开始时根据糖含量进行分类。10 月第 3 周含糖量高的树木一直保持高含糖量,直到 11 月第 2 周。相比之下,最初含糖量低的树木在 11 月的第二周之前保持低含糖量。因此,低糖含量的树木可能会受益于量身定制的农业实践,例如避雨棚种植、灌溉控制、叶面施肥、适当修剪和疏果以提高其糖含量。同样,当聚类分析识别出果实非常小的树木时,可以同时应用疏果或延迟收获等农业实践。因此,聚类分析可以成为个性化农业的另一种统计工具,通过确定单棵树木提高糖含量和果实大小的具体需求。
 
果园级别的混合效应模型展示了每个果园内个性化农业的潜力。当仅考虑收获时间和五种果园级别的农业实践时,解释了 19% 的糖含量差异 (R2= 0.19)。然而,果园水平的混合效应模型解释了糖含量 (R2= 0.38),这表明目前的果园层面的做法解释果园之间糖含量变化的能力有限。另一方面,当应用树级模型时,解释了 66% 的糖含量方差 (R2= 0.66)。图 9 显示了糖含量预测值和观测值的散点图,突出了场间分析之间的不同预测能力(图 9)。9A) 和场内分析(图9B). 田间分析的预测能力似乎优于田间分析,这意味着农民除了果园级管理(精准农业)之外,还可以从树木级管理(个性化农业)中受益,并且农业 DT 可以成为监测果园中单棵树木的有用工具。因此,DT 的发展有可能开启从精准农业到个性化农业的过渡。所有补充数据用于创建补充数据中提供的所有图表(图 1 至 9)和补充图表(补充图 1 和 2)。
 
图 9:预测的糖含量与真实(观察到的)糖含量的散点图。
图 9
场间混合效应模型产生 R2= 0.380 (A) 的 S Alpha S T场内混合效应模型导致 R2= 0.662 (B) 的源数据作为 源数据 文件提供。
 
全尺寸图像
农业 DT 示范
为了进行演示,使用农业 DT (https://stevenkimcsumb.shinyapps.io/ShinyDT/) 演示了 Iab 果园的一棵树。在网页中,用户可以选择果园 (Iab),点击下面的提交按钮,选择第五棵树 (Iab-5),然后点击下面的提交按钮。提交后,显示了九个面板:地图、土壤、天气、农业实践、糖含量分布、水果大小分布、糖含量历史和水果大小历史。“地图”面板显示济州岛 Iab 果园的位置。土壤面板显示了与岛上其他区域相比,每种土壤成分(可用磷酸盐、可交换钾、可交换钙、可交换镁、土壤酸度、有机质、电导率)的百分位数。它还显示观察到的水平是否在 RDA 建议范围内。Weather (天气) 面板显示与岛上其他区域相比的温度、湿度和气压百分位数。农业实践小组将五种农业实践(施肥、覆盖、喷洒、修剪和疏伐)与岛上的其他果园进行了比较。Sugar Content Distribution 和 Fruit Size Distribution 分别比较糖含量和果实大小。在每个面板中,将 Iab 果园与岛上的其他果园进行比较,并将 Iab-5 树与 Iab 果园中的其他树木进行比较。Sugar Content History 和 Fruit Size History 分别显示了果园级别和树木级别的糖含量和果实大小的每周模式。DT 将显示果园水平 (Iab) 和树木水平 (Iab-5) 的平均糖含量和果实大小分别随时间增加和减少。
 
讨论
用于土壤管理的数字孪生
将详细的土壤信息纳入精准农业的区域监测将非常有益。一种有前途的方法是利用 ref 提出的卫星图像分析。31.该方法涉及对通过遥感获得的数据进行分析,从而可以逐田可视化单个土壤成分的分布。它还可以提供精细的土壤信息。他们证明,近红外光谱技术可以有效地测量土壤中的氮、磷和钾。这种无损方法可以解决与传统破坏性土壤测量方法相关的缺点。此外,它还可以与来自无人机或卫星的图像数据相结合,以简化和加快数据采集过程。例如,利用 Landsat 的数据生成了田间规模的土壤水分地图8,32,包括归一化差值植被指数和地表温度。此外,通过整合土壤水分和玉米产量数据,建立了产量预测模型33.使用来自卫星图像的果园级土壤化学信息,开发一种可以生成区域和果园级土壤剖面图并预测水果质量的 DT 是可行的。
 
果树比其他作物占据更大的空间,果园空间内的土壤成分各不相同。果树直接受到树下土壤的影响,而不是整个田地中的所有土壤。此外,在果园的二维空间内实现均匀的肥料分配具有挑战性,并且根据区域或果园级别的土壤化学成分来辨别水果质量的变化变得更加复杂。如果我们可以使用物联网传感器测量特定点的土壤化学成分,那么根据每个成分的需求进行施肥是可行的。这意味着每棵树都将获得其最佳生长所需的精确数量的土壤养分,并且特定点施肥将通过最大限度地减少肥料滥用来促进精准农业和精准保护。
 
代表土壤化学特性的地图应在网站上提供田间每个点的交互式土壤和水果信息,以及为利益相关者(例如,政策制定者、研究人员、农民)提供空间信息。GIS 是分析与位置相关的所有数据的基本框架。展望未来,有机会将空间信息与水果质量、天气状况和农业实践(包括喷洒、修剪和疏伐等活动)的数据集成。此集成提供区域级别、果园级别和树级别的信息。
 
用于农业实践管理的数字孪生
农业实践对水果质量有直接而重大的影响。与某些环境因素不同,这些做法受人类控制,可以全年实施。随着更多数据的积累,农业实践的月度记录变得越来越有价值。此外,来自特定果园的邻近果园的农业实践信息比来自遥远地区的信息更相关。此本地化信息植根于本地环境,并考虑了字段间的变化。喷洒数据与空间和天气数据相结合,可以作为有效的病虫害监测系统。由于真菌病害的传播与雨滴和风等天气条件密切相关34,35 元,该系统可用于预测疾病爆发并促进预防措施。通过密切监测和分析疾病爆发的时间序列数据以及空间信息,可以降低疾病传播的可能性或减少由于疾病传播而造成的损失。重要的第一步是建立自动化系统,以便对所有果园进行频繁的数据收集和管理。
 
农业实践的重要性可以通过提高水果产量来评估。例如,修剪在塑造树木和促进花芽分化方面起着至关重要的作用,直接影响果实生产。通过精心组织与修剪相关的数据(例如修剪技术、花芽的位置、修剪产生的副产品重量等)和调查项目的元数据,可以彻底分析修剪与水果生产之间的相关性。此外,这种方法允许基于修剪方法对不同品种之间的产量变化进行全面调查。因此,可以利用农业 DT 的功能来为特定品种创造最佳环境条件。
 
用于天气信息管理的数字孪生
天气信息在农业实践和水果质量中起着至关重要的作用。例如,花或果实的疏果应在开花期开始,使用疏果化学品时避免下雨很重要。应根据天气信息决定农业实践的时间,并且可以将其安装在 DT 中。此外,开发各种天气指标和元数据以研究它们对特定目标(例如水果质量)的影响(基于作物种类)也至关重要。这是必要的,因为每种作物都有其独特的最佳环境条件。
 
用于水果质量管理的数字孪生
首要目标是提高水果质量,但与之相关的因素太多。正如本研究所介绍的,果园之间和果园内的水果质量差异很大(例如,图 1 中的 Iab 果园。8). 特别是,鉴于定期数据更新,可以监测树级变化和纵向模式以进行质量控制。从这个意义上说,个体化农业将成为未来可行的农业系统。目前的农业系统在温室等小面积区域生产高质量产品,未来可以扩展到大面积的开阔田地。个性化农业的应用不仅对于大面积生产高质量农产品至关重要,而且对于多品种、小规模生产系统也至关重要。近年来,在太空发展的背景下探索了太空农业,个体化农业的应用是在有限的空间内生产农产品的基础。
 
农业 DT 必须成为利益相关者的共享工具。它需要利益相关者之间积极讨论,定期更新,并持续改进以获得有用的实际反馈。对于政策制定者来说,像图 .2 可以指导他们的区域决策。这些信息可以反映在济州岛负责农业土壤和肥料供应的政策制定者的预算中。对于分销商,像 Figs.6、7 和 8 可以支持果园间质量评估和跟踪。如果可用的信息比本研究中提供的更详细,DT 可以提供有关产量预测、预期利润和分布式水果管理的信息。对于研究人员来说,像 Figs.3 和 4 可以帮助理解区域和果园间的变化,生成和测试假设,并提出实用的建议。他们甚至可以按品种计划匹配的研究,并进行针对品种的研究。最后,对于农民来说,图 .8 可以帮助评估果园内的水果质量,并在执行特定农业实践后监测纵向模式,而 DT 可以在树一级提供详细信息。
 
提高或保持水果的高品质既是科学也是艺术,农民应在经验证据和农民的观察、经验和知识之间取得平衡。在这一点上,个性化的树木级管理是否比区域或果园级管理更有利可图,这是一个悬而未决的问题。我们需要考虑如何降低实施 DT 的成本。截至目前,实施 DT 的好处大小尚不清楚,我们需要一种科学的方法来解决这个问题。我们需要使用对照随机实验将当前的区域或果园级别的做法与由 DT 指导的新个体农业进行比较。将果园分为控制区和实验区,有必要确认和估计 DT 的好处。这项研究仅限于有观察数据的柑橘水果,但我们希望观察和试验更多种类的水果。与目前的技术进步速度不同,这将是一个耐心的过程。
 
将个性化农业应用于谷物或蔬菜作物非常具有挑战性。由于谷物或蔬菜作物的单个植物在基因上并不相同,因此很难期望在相同的环境或管理下具有相同的质量或产量。相比之下,水果作物(如柑橘)相对容易在个体层面进行研究,并且应用个性化农业是可行的,因为每棵树都通过无性繁殖繁殖并且具有相同的基因组。因此,在研究种植单一品种(基因型)的果园时,它们表现出的表型变化会受到环境和农业实践(管理)的影响。研究这种基因型×环境×管理交互仍然极具挑战性,需要更多的实验来解决这个复杂的问题。从消费者的角度来看,无论个体化农业的科学价值如何,大多数消费者都不会在韩国和其他地方购买 10 美元的优质柑橘。未来的研究应该解决降低数据收集、精准农业和个性化农业的成本和劳动力问题。
 
我们研究团队的长期目标是通过交互式数字平台,根据利益相关者的目标和需求,使区域、果园间和果园内的信息更加完整和可访问。我们目前正在开发一种简化的流程,该流程通过 Open API 自动检索数据,将其安全地存储在云服务器上,进行全面分析,并将结果传播到各种 IT 设备。作为第一步,我们根据我们目前获得的所有信息开发了一个可免费访问的网页 (https://stevenkimcsumb.shinyapps.io/ShinyDT/) 用于演示目的。这个版本的 DT 没有展示如何自动建议农业实践以及如何评估农业实践对水果质量的影响,这是我们研究的一个主要局限性。当前形式的交互式小程序将随着时间的推移而改进,并与利益相关者进行沟通,以便在闭环中运行。我们预计,农业 DT 将通过农业研究人员、农民、统计学家、软件工程师等之间的跨学科合作,开启个性化农业的新时代。
 
方法
通过 Open API 获取数据资源和收集
从数据门户 (https://www.data.go.kr) 上的多个来源收集了可公开访问的开放 API,这些 API 是开发用于柑橘园管理的农业 DT 的潜在来源。包括数据收集、解析和分析在内的所有过程均使用统计软件 R 执行36.区域代码从 MOIS 获得,土壤数据从韩国 RDA 获得,柑橘园的水果质量、天气和农业实践数据来自 JDC(图 D)。1).
 
2020 年至 2022 年分析的土壤数据由济州行政区使用“xml”收集37和 'jsonlite'38软件包。对济州岛 30,261 份农业土壤的化学性质进行了爬行,并使用了 5939 份果园土壤进行分析。土壤数据包括可用的磷酸盐、外含钾、钙和镁、pH 值、有机质和电导率。
 
JDC 随机选择了济州岛的 30 个柑橘园,并收集了每个果园的天气、农业实践和水果质量数据。天气数据是通过在每个果园安装一个传感器获得的,该传感器能够记录温度、相对湿度和气压(日平均)。农业实践数据由农民自我报告,他们报告了实践类型、处理量、日期、单位和农用化学品名称。每个果园随机抽取 100 棵柑橘树,在 2021 年 10 月的第三周至 11 月的第四周对这些树木进行反复观察。糖含量 (°Brix)、果实大小 (mm) 和果实位置 (高、中、低) 记录,每棵树每周重复 3 次(每个果实位置水平 1 次)。这些水果质量数据由研究人员使用破坏性测量方法手动测量。所有水果水平的信息(含糖量、果实大小和位置)都与月、周、日和标签号(树标识号)相匹配。有关更多信息,请参阅 Data Availability 部分。
 
数据解析
地理编码是将地址信息转换为地理坐标(纬度和经度)的计算过程,可用于映射位置。济州岛与土壤数据相关的所有地址信息都集成到一个文件中进行地理编码。所有数据都通过 Kakao 开发的服务器进行地理编码以添加空间信息,并使用包括“rjsonio”在内的 R 包合并所有数据39、'data.table'40, 'dplyr'41和 'httr'42.
 
通过合并地理编码数据和土壤数据创建了一个数据框,并使用包括“terra”在内的 R 包将其用于地图可视化43、 'maps'44、 'sp'45和 'sf'46.对于这种地图可视化,使用了 NSDIP 提供的 GIS 地图(形状文件)(图 D)。1). 区域水平、果园水平和树木水平的数据被合并并用于果园间分析(例如,果园之间的变化)和果园内分析(例如,同一果园内树木之间的差异)。结合所有数据,创建了包含四种信息(土壤、天气、农业管理实践和水果质量)的农业 DT。
 
区域尺度的数据可视化和分析
对于区域尺度的数据可视化,使用 QGIS 程序 (v 3.26.2) 通过形状文件创建了 1 公里的网格地图47,并在对每个网格内每个土壤化学成分的观测值进行平均后,将其与土壤数据(可用磷酸盐、外径 K、Ca 和 Mg、pH 值、有机物和电导率)相结合(图 D)。2A-G)。KDE 用于描述每个土壤成分的区域级别。核平滑强度函数可以通过给定土壤数据值以及相关的经度和纬度来估计。有些区域的数据稀疏,并且假设当两个区域彼此更接近时,土壤条件更加相似。KDE 用色标绘制,以表示土壤数据的位置和观测值。为了清晰直观地表示,该图通过使用估计密度值的前 25% 集中了土壤数据收集的区域48.
 
每个果园的位置可以通过其经度和纬度来识别,这些信息被用于随着时间的推移进行质量的区域展示。每个果园的平均果实大小和含糖量在以下三个时间段取平均值:10 月的第 4 周和第 5 周、11 月的第一周和第二周以及 11 月的第 3 周和第 4 周。在给定的经度和纬度处绘制时间平均值(图 D)。3).
 
使用平滑样条线可视化相对于每个土壤和天气相关变量的果实大小和糖含量的观察趋势(图 D)。4). 当无法获得果园确切位置的土壤相关数据时,根据与果园的欧几里得距离对土壤数据进行排序,并使用近处位置的平均值作为近似值。区域尺度分析用于描述目的,我们在这里声明它不是用于因果推理,因为合并的数据不是从实验中获得的。
 
果园间分析
农民的管理实践是区分果园的因素。这些都很重要,因为农民可以决定和控制与开阔田地中的天气条件不同。农民自我报告了他们在 2021 年 1 月至 10 月期间记录的农业实践,包括间伐、覆盖、喷洒(害虫防治)、施肥和修剪。每个果园每次练习的频率和时间各不相同,每种农业练习的月频率通过山脊图可视化(补充图 1)。1).
 
出于演示目的,我们随机选择了两个果园(种植相同的品种),并比较了它们观察到的土壤条件、农业实践和水果质量(图 D)。5). 然后,我们按果园(27 个果园)分离水果质量数据,按含糖量中位数和果实大小中位数对果园进行排序,并使用箱线图以图形方式描述果园内含糖量和果实大小的变异性(图 D)。6). 为了可视化果园平均含糖量和平均果实大小的纵向模式,我们使用了 10 月中旬至 11 月下旬的意大利面条图(补充图 D)。2).
 
为了量化由果园和收获时间解释的糖含量和果实大小的变化,R2是在混合效应模型下计算的。该统计模型考虑了果园内水果质量的相似性,当果园内观察到的水果质量值相关时,它尤其有用,这是一个合理的假设,如图 1 所示。6 和补充图2. “lme4”49、 'lmerTest'50和 'MuMIn'51在 R 中用于此分析的包。在这个混合效应模型中,果园被视为随机效应,时间被视为固定效应。根据时间与水果品质之间的关系计算双侧 p 值,并针对多重测试调整 p 值52.
 
当果园级别的变量可以预测水果质量时,农业 DT 可能更有价值。除了上述果园级别的变量外,果园级别的天气变量(温度、湿度和气压)也被考虑用于糖含量和果实大小的预测分析。为了衡量这些果园级别变量的预测能力,实施了自动机器学习 (AutoML) 算法,其中包含以下预测变量:时间(周和月)、三个天气变量(温度、湿度和气压)、五种农业做法(间伐、覆盖、喷洒、施肥和修剪)的频率,以及果园指数。AutoML 算法比较了多种机器学习算法的预测性能,并自动选择了最佳算法。AutoML 是使用“h2o”包实现的30在 R 中。绘制预测值和观察值(图 D)。7) 和 R2计算 、 RMSE 和 MAE 以衡量预测性能。
 
果园内分析
如前所述,每个果园每周随机选择并观察 100 棵树,每棵树都由一个唯一的标签编号标识。根据离地面的高度确定水果位置分为三个级别(低、中、高)。每周从每棵树的每个位置采集一个果实,因此每周每个果园总共观察到 300 个果实。选择一个果园,并使用分层聚类分析对相似的纵向趋势进行分组以进行演示(图 D)。8).
 
除了果园层面的变异(果园间)之外,我们假设树木层面的变异(果园内)是另一个层次的随机效应。我们在上述混合效应模型中添加了树级随机效应。在该统计模型下,果园和树木被视为独立的随机效应,时间和果实位置被视为固定效应。计算固定效应的双侧 p 值,并针对多重检验进行调整52.通过绘制预测值来比较果园间分析和果园内分析的可预测性,并将糖含量的观察值可视化(图 D)。9). 这种比较是为了证明除了果园层面的分析之外,树木层面分析的潜在好处和必要性,以解释水果质量方差的未知来源。
 
农用 DT 接口小程序
数据收集和分析不足以实现成功的个性化农业,农民应定期监测每棵树。在这方面,如果一个用户友好的小程序提供一个人的果园(以及与附近其他果园的比较)和一棵特定的树(以及与果园中的其他树的比较)的摘要,那将很方便。对于使用当前可用数据的演示,我们创建了一个界面小程序,可以免费且易于访问。如果用户先选择果园,然后选择感兴趣的树木,则交互式小程序会提供以下信息:(1) 果园的地理位置,(2) 区域土壤成分,以及 RDA 建议以及与济州岛其他果园的比较,(3) 天气信息,与其他果园的比较,(4) 农业实践与其他果园的比较, (5) 果园间和果园内含糖量的比较,(6) 果园间和果园内果实大小的比较,(7) 果园间和果园内含糖量的历史,以及 (8) 果园间和果园内果实大小的历史。
 
报告摘要
有关研究设计的更多信息,请参阅本文链接的 Nature Portfolio Reporting Summary。
 
数据可用性
图窗的数据在 Source Data 文件中提供。本研究中使用的所有数据(土壤化学特性、水果质量、天气、农业实践和 GIS 地图)都存放在 Github (https://github.com/heoseong/Digital_twin) 和 Zenodo 存储库 (https://zenodo.org/records/10531851, https://doi.org/10.5281/zenodo.10531851)53.本研究中使用的数据(土壤化学特性、水果质量、天气、农业实践)在注册和授权过程后可通过开放 API 在开放数据门户 (https:///www.data.go.kr) 中获得。本研究中使用的济州岛 GIS 地图上的数据在注册和授权过程后可在国家空间数据基础设施门户 (https://www.vworld.kr) 中获得,并且访问权限仅限于韩国用户。济州岛的区域代码可在内政和安全部 (https://www.code.go.kr/stdcode/regCodeL.do) 中找到,用户必须在区域选择 (지역선택) 的城市/省 (시/도) 下拉菜单中指定韩语的济州岛 (제주특별자치도) 以获取相关数据。源数据随本文提供。
 
代码可用性
所有代码和相关数据都可以在 Github (https://github.com/heoseong/Digital_twin) 和 Zenodo 存储库 (https://zenodo.org/records/10531851 中找到,https://doi.org/10.5281/zenodo.10531851)53.小程序 (Shiny DT) 的源代码也可以在同一个 Github 和 Zenodo 存储库中找到。
[返回]

下一篇:通过开放和标准化的数据集加强人类流动性研究