全球海洋鱼类物种灭绝风险大幅上升！基于数据挖掘与模型的综合预测-

全球海洋生态系统正面临着生物多样性迅速丧失的危机。由于气候变化、过度捕捞、栖息地破坏和污染等因素，许多海洋物种的数量正在急剧下降。硬骨鱼类作为海洋生态系统中的重要组成部分，其灭绝风险的增加对整个生态系统的稳定性和功能性产生了深远影响。**尽管世界自然保护联盟濒危物种红色名录（IUCN RedList）等提供了大量关于物种保护状态的数据，但仍有大量鱼类物种由于数据不足，而未被评估。**这些数据不足的物种，往往是最易受到威胁的，因为缺乏足够的科学信息来制定有效的保护措施。

近日，一项令人震惊的研究表明，全球海洋鱼类灭绝的风险远高于之前的估计。“海洋与湿地”（OceanWetlands）小编注意到《公共科学图书馆生物学》（PLOS Biology）期刊2024年8月29日发表的一篇最新研究，敲响了警钟——海洋生态系统正面临着前所未有的危机。研究人员利用机器学习算法，预测了全球海洋鱼类的灭绝风险，为制定海洋鱼类保护策略提供了重要依据。

（根据IUCN红色名录的最新评估，全球有超过45,300种物种面临灭绝风险，占所有被评估物种的比例高达28%。上图来源：世界自然保护联盟濒危物种红色名录）

上图：根据IUCN2024年的评估，物种状态被划分为三个主要类别：受威胁（包括极危、濒危、易危）、非威胁（近危、无危），以及数据不足与未评估。由于部分物种尚未被纳入IUCN红色名录，研究团队通过国际鸟盟、爬行动物数据库、哺乳动物多样性网和全球两栖动物网等资源更新了物种列表。图源：Loiseau, Nicolas, et al.（2024）

根据IUCN的分类，海洋鱼类中有38%（约4,992种）被列为数据不足或未评估物种（DDNE），这使得现有的保护措施难以全面覆盖所有面临威胁的物种。为了填补这些数据空白并为全球保护优先级提供更科学的依据，Nicolas Loiseau及其团队开展了这项研究。为了解决这一问题，Nicolas Loiseau及其团队利用先进的机器学习技术展开了这项研究。他们结合了随机森林模型（RF）和人工神经网络（ANN），对4,992种数据不足或未评估的海洋鱼类物种进行灭绝风险预测。这项研究旨在解答几个关键问题，包括哪些物种特征最能预测灭绝风险，受威胁物种的分布如何影响灭绝风险热点区域，现有的海洋保护区网络是否覆盖了这些受威胁物种，以及如何调整保护优先级以实现“30 × 30”目标，即到2030年全球至少保护30%的海洋面积。

鲸鲨是软骨鱼纲须鲨目鲸鲨科的鱼类。作为地球上最大的鱼类，鲸鲨在生物分类学上独树一帜。摄影师：宋刚 ©绿会融媒·“海洋与湿地”（OceanWetlands）获授权使用（图文无关）该研究团队使用了现有的物种分布数据、生物学特征、分类信息和人类利用情况等数据，通过RF和ANN模型对4,992种数据不足或未评估的海洋鱼类物种的IUCN状态进行了预测。研究结果显示，海洋鱼类的灭绝风险远高于IUCN的初步估计，从2.5%增加到12.7%。预测为受威胁的物种，通常具有较小的地理分布范围、大体型和低增长率。这些特征表明，这些物种可能面临更大的环境压力和更高的灭绝风险。受威胁物种的热点区域主要集中在南海、菲律宾海、苏禄海、澳大利亚西海岸和北美洲西海岸。

上图：研究人员对4,992种数据不足和未评估的海洋鱼类进行IUCN状态推断的建模框架如上图所示。首先，他们利用现有的物种出现数据、生物学特征、分类学信息和人类利用情况（图A），建立了一个集成学习模型，结合了随机森林（RF）和人工神经网络（ANN）（图B），以预测海洋鱼类的IUCN状态。通过将ANN和RF的预测结果进行互补性决策（图C），进一步探讨了将预测出的受威胁物种纳入当前保护规划优先区域的可能影响（图D）。图源：Loiseau, Nicolas, et al.（2024）

该研究还发现，当前的海洋保护区网络可能未能覆盖所有受威胁的物种。因此，研究建议根据预测结果调整保护区的划定，以更好地保护这些受威胁的鱼类物种。同时，研究提出，将多因素集成学习方法应用于物种灭绝风险评估，可以提供对濒危分类群的更全面的视角，有助于实现《昆明-蒙特利尔全球生物多样性框架》（GBF）中有关全球生物多样性保护的“30 × 30”目标。

深海幽暗，栖息着无数适应极端环境的奇异生物。2024年7月，在前往纳斯卡公海探险的途中，科研人员在智利海岸附近观察到了一只漂亮的鮟鱇鱼。这种鱼类身形矫健，善于隐蔽。图源：Schmidt Ocean（2024年7月发布）通过这项研究，科学家们填补了海洋鱼类保护中的数据空白，为全球保护优先级的调整提供了新的视角。研究表明，海洋鱼类的灭绝风险比此前估计的更高，未来的保护工作需要更加关注数据不足的物种和关键热点区域，以便更加精准和有效地应对全球生态危机。

海洋与湿地·小百科
随机森林模型随机森林（Random Forest）模型是一种集成学习算法，通过构建多个决策树并将它们的预测结果进行综合，从而提高分类和回归任务的准确性与稳定性。每棵决策树都基于原始数据集的随机子集，并在特征的随机子集上进行训练，这种方法有效减少了过拟合的风险。最终，随机森林通过对所有决策树的预测结果进行投票（分类任务）或求平均（回归任务）来得出最终结果，广泛应用于生物信息学、金融预测、医学诊断等领域。

在本研究中，随机森林（RF）模型被用于预测物种的世界自然保护联盟濒危物种红色名录的物种濒危状态。该模型之所以被选用，是因为其集成了多个决策树，通过对每棵树的预测结果进行汇总，能够显著提高分类的准确性和稳定性。相比于其他算法，随机森林能有效减少过拟合现象，这在处理涉及大量变量和复杂数据的物种状态预测时尤为重要。通过对数据集的随机抽样和特征选择，RF模型能够提供更为可靠的濒危预测结果，有助于更准确地识别和保护那些面临较高灭绝风险的物种。

人工神经网络人工神经网络（ANN）是一种受生物神经系统启发的计算模型，用于处理复杂的非线性问题和模式识别任务。它通过模仿人脑神经元的连接和信号传递方式，构建由多个层次的神经元组成的网络，层与层之间通过加权连接进行信息传递和处理。ANN可以自动从数据中学习并提取特征，适用于处理大规模数据集和进行预测分析。在上面的这个研究中，人工神经网络被用来预测物种的濒危状态，利用其强大的数据处理能力和模式识别优势，帮助识别潜在的威胁物种。

互补决策树互补决策树（complementary decision tree）是一种结合不同预测模型结果的技术，旨在提高分类或预测的准确性。该方法通过将多个模型的输出进行综合，以减少单一模型可能出现的偏差或错误，从而获得更可靠的预测结果。在互补决策树中，首先利用多个预测模型（如本研究中，用的是随机森林、人工神经网络）分别进行预测，然后通过制定规则将这些模型的结果进行整合。比如说，假如两个模型对某一物种的预测结果一致，则直接采用该预测；如果模型之间的预测结果不一致，那么就可以保留为数据不足（DDNE，数据不足或未评估）状态。通过这种方法，可以更全面地考虑各种模型的优劣，提升预测的精度和可靠性。

保护优先级排名保护优先级排名（Conservation Priority Ranking）是指在保护规划中，根据物种或生态系统的保护需求、面临的威胁程度及其重要性，对不同地区或保护对象进行排序，以确定哪些区域或物种应当优先获得保护资源和管理措施。这个排名有助于优化资源分配，确保最需要保护的对象得到优先关注和支持，从而有效提升整体保护效果。

系统发育保守性系统发育保守性（Phylogenetic Conservatism）指的是在物种进化过程中，某些生物特征和性状在系统发育树上被保留和传递的现象。简单来说，就是生物家族的“遗传密码”。就像人类家族有家族遗传病一样，生物物种也有自己的“家族遗传特征”。亲缘关系越近的物种，它们共同祖先的“遗传密码”就越多，因此它们的性状也就越相似。这种保守性意味着，物种在特定特征上的相似性往往反映了它们的共同进化历史。也就是说，系统发育上较近的亲缘关系物种更可能具有相似的特征，因为这些特征在其共同的祖先中就已经存在并被继承下来。这种保守性在研究生物特征的演变、生态适应和系统发育关系时具有重要意义。

全球海洋生物多样性信息系统互补决策树（complementary decision tree）是一种结合不同预测模型结果的技术，旨在提高分类或预测的准确性。该方法通过将多个模型的输出进行综合，以减少单一模型可能出现的偏差或错误，从而获得更可靠的预测结果。在互补决策树中，首先利用多个预测模型（如本研究中，用的是随机森林、人工神经网络）分别进行预测，然后通过制定规则将这些模型的结果进行整合。比如说，假如两个模型对某一物种的预测结果一致，则直接采用该预测；如果模型之间的预测结果不一致，那么就可以保留为数据不足（DDNE，数据不足或未评估）状态。通过这种方法，可以更全面地考虑各种模型的优劣，提升预测的精度和可靠性。海湿小编看到这个词在这篇研究的全文中一共出现了两次，所以专门拧出来做个词条，供读者了解。

思考题·举一而反三
【Q1】如果您看这项研究的过程，会发现他们使用了随机森林（RF）模型与人工神经网络（ANN）模型。考虑到研究中这些模型的预测精度差异，那么，如何结合这两种模型的优势，并利用数据融合技术进一步提升对稀有或数据不足物种的风险评估准确性？

【Q2】研究结果揭示了新的预测数据对海洋保护优先级产生了显著影响。例如，西澳大利亚和北美西海岸的新兴受威胁物种热点已被发现。那么，基于这些发现，如何重新审视全球保护网络的有效性，并制定具体的行动计划，以应对这些新出现的保护热点？

【Q3】根据研究发现，受威胁物种的地理分布在预测后发生了显著变化，例如在南中国海、菲律宾海和日本南部海域的新受威胁物种聚集。那么，可以怎样来利用这些地理数据变化，用来评估气候变化对物种灭绝风险的影响，并将这些评估结果融入未来的气候适应性保护策略中呢？

【Q4】如何根据这些新的数据，更新和校正IUCN濒危物种红色名录，以更准确地反映物种面临的实际威胁？此外，如何通过调整红色名录中的物种状态，优化现有的保护策略，以应对新兴的热点区域？

【Q5】在使用先进数据挖掘技术和深度学习模型来预测鱼类保护状态时，如何有效地平衡数据质量和模型预测的准确性，以应对数据不完整和偏差问题？在进行海洋鱼类保护优先级排序时，如何确保所采用的保护目标和方法能够公平地考虑到所有物种的保护需求，尤其是那些分布范围狭小但生态重要性高的物种？

本文仅代表资讯，供读者参考，不代表平台观点。

编译 | 王芊佳
编辑 | Sara
排版 | 绿叶

参考资料略