中国草学会

会员登录 会员注册
奖励评价
科学普及
研究进展
会员之家
会议系统
 

关注中国草学会

 

关注中国草学会信息之窗

PNAS: 人工智能与生态学的协同未来

发布时间:2023年10月25日 来源:中国草学会

PNAS: 人工智能与生态学的协同未来

NewEcologist 生态学家

      生态学和人工智能领域的研究都致力于对复杂系统的预测性理解,而复杂系统的非线性则来自多维度的相互作用和多尺度的反馈。一个世纪以来,计算和生态学研究取得了独立、不同步的进展;然而,在全球变化的背景下,两个学科迫切需要有意识地协同合作,以应对当前的社会挑战。这些挑战包括理解系统级现象的不可预测性以及快速变化的地球上的恢复力动态。在此,本文强调生态学与人工智能融合研究范式的前景和紧迫性。即使使用当今最著名的人工智能技术:深度神经网络,也很难对生态系统进行全面、整体的建模。此外,生态系统具有突发性和恢复的行为,这可能会激发新的、稳健的人工智能架构和方法。本文将举例说明生态系统建模方面的挑战如何从人工智能技术的进步中获益,而人工智能技术本身也受到了其所要建模的系统的启发。这两个领域在向这种融合发展的过程中相互启发,尽管是间接的。本文强调需要更有目的性的协同,以加快对生态恢复力的理解,同时建立现代人工智能系统目前所缺乏的复原力。持续存在的认识论障碍将受益于两个学科的关注。成功融合的意义不仅在于推动生态学科的发展或实现人工通用智能--它们对于在不确定的未来持续发展和繁荣都至关重要。

      要应对多种相互关联的现象,包括疾病爆发频率的增加、全球生物多样性的指数级损失以及气候变化的深远影响,了解生态至关重要。这些危机都有一个共同点:它们产生于复杂系统的扰动,而复杂系统的高维度支撑着难以预测的非线性动态。人工智能的进步有可能改变我们对生态系统的理解。同时,生态系统本身也是推动人工智能进步的动力。在多尺度、依赖环境和观测不完全的生态系统中普遍存在的挑战提供了一系列问题,通过这些问题,人工智能更接近于实现其全部潜力。预测和有目的地管理对自然复杂系统的扰动所造成的结果是我们这个时代面临的一项巨大挑战,它要求人工智能与生态科学大胆地协同融合,以实现更全面的理解,从而为行动提供依据——创造系统智慧,实现具有恢复能力的未来(图 1)。

▲图1 | 数据、信息、知识和智慧之间相互联系的示意图。

      数据反映了原始观测或测量结果(例如,卫星数据,如特定地点的海面温度(SST)),而将这些测量结果综合成有意义的形式则构成了信息(例如,以时间序列图的形式为 SST 测量结果提供空间或时间背景)。知识增加了背景,提供类似的例子或与其他知识系统进行比较(例如,一些海洋生物会经历热应力)。最后,智慧会考虑所有这些因素以及社会或文化价值,以评估可能采取的行动(例如,限制碳排放以减轻气候变暖的有害影响)。箭头表示机器学习(ML,蓝色)和生态系统研究(黄色)如何在此框架内建立联系。ML 可以将数据转化为信息,但也可以绕过信息步骤,直接进行推理,并将其作为知识传达。相比之下,生态学的双向箭头代表了对数据收集过程的迭代反馈,以便通过统计建模和假设完善来实现知识。如果我们能将各学科的优势结合起来,明确识别偏差,管理不确定性和不同的认知方式,尤其是在信息和知识层面,那么人工智能和生态系统科学的有意协同进步可能会促进对复杂系统功能的更深入理解、预测和保护。

      正如人类从数据中学习模式以建立对系统的智能思考一样,人工智能是现代人工智能的基础,其近似目标是在特定领域执行任务或做出决策。将人工智能工具应用于生态领域,大大提高了我们量化以前无法量化或难以观察的现象的能力,并为更快、更准确地预测生态系统提供了可能。最近的例子包括通过摄像头和声学数据研究生物与其环境之间的相互作用;将地球系统卫星数据提炼为有意义的生态功能(如生产力);通过深度学习和姿势估计分析动物行为;利用生物信息学预测和验证新病毒是否能够感染人类;以及哪些动物物种最有可能携带这些病毒。
      这些都是"AI for Ecology"的例子--将现有的人工智能工具应用于生态问题。然而,生态科学启发人工智能新范式的另一个方向也同样重要。人工智能研究的终极目标是实现人工通用智能(AGI),能够推断和推理其他领域和系统,与人类智能类似。AGI 很可能需要将数据驱动的 ML 与表现和推理不同知识类型的新方法结合起来,以应对对无模拟未来进行可信预测的挑战,例如我们在瞬息万变的地球上所预测的未来。从根本上改变人工智能与生态研究相互推动的方式,可能有助于应对这些挑战。

      本文发现,生态学研究与人工智能研究的融合即将到来,而生态学研究历来落后于人工智能和计算科学的发展(图 2)。这种融合寻求新的思维范式,以支持对未观察到(或无法观察到)的系统和未来进行智能推断。本文的论点超出了 "AI for XX"范式,即简单地将人工智能应用于XX领域。向共同生产、融合研究的转变有可能推动下一代人工智能的进步和对生态的理解。

▲图2 | 生态建模中计算方法的弧线(黄色)落后于计算方法本身的发展(蓝色),但已接近趋同。

      两种科学认识文化的融合将有助于这种趋同。生态学的主要目标是理解跨越物理和生物的复杂系统。这种理解通常体现在数学模型中,数学模型反映了我们对产生可观测结果的协同作用机制的假设。但是,生态学既不会屈服于 "数学的不合理有效性"(如纯物理现象),也不会屈服于 "数据的不合理有效性"(如某些生物现象)。简单的数学方程无法完全捕捉到生态系统的本质。同样,复杂的 ML 模型也不能很好地概括意外扰动带来的非线性--ML 模型从数据中获得算法理解,而这些数据往往是关于一个特定系统的。此外,由于生态学研究的目标不仅仅是预测,而是对复杂系统的现象学和机理的理解,因此生态学家在不同尺度上使用各种建模技术,这些建模技术以系统级的整体方式连贯地捕捉突发特性,有利于进一步的研究。这种方法与人工智能研发形成了鲜明对比,在人工智能研发中,多个模型之间的冲突并非不可取,因为这些模型只是用于预测(哪个模型表现最好),而不是用于解释(为什么一个模型比另一个模型表现更好)。例如,人工智能中的大型语言模型会显示出小型语言模型所不具备的新兴行为,但目前的人工智能技术却无法解释这些行为。生态系统研究的工作方式是优先了解我们所观察到的数据的生成机制,这可以推动人工智能研究人员将重点放在能够更深入地了解这些观察到的现象背后的原因的方法上--系统中的哪些定量变化会导致系统行为的定性变化。
 

      生态系统的一个重要新兴行为--如果可以说是一种智能--就是它们对扰动的惊人恢复力。这种特性进一步表明,生态学是人工智能的灵感源泉,而人工智能在为神经启发式人工智能的现有脆性智能注入弹性方面只取得了喜忧参半的成功。因此,不仅是不同的、综合的生态系统建模方式有助于推动人工智能研究,而且生态系统本身也能为人工智能的稳健多尺度架构提供灵感。[这与量子化学和量子计算之间的协同关系不谋而合。]

      通过共同开辟一条相互交织的研究道路,人工智能和对生态的理解能够很好地相互促进,超越每个学科独立完成的领域。在未来,人工智能研究发展与生态学研究的协同作用将推动人们在与社会需求相关的时间和空间尺度上理解复杂的生态系统。下面,本文将介绍人工智能研究的现状(第 1 节)。本文简要追溯了生态系统建模的历史,直至目前深度神经网络的使用(第 2 节),并阐述了人工智能与生态学融合研究的机遇。然后,本文将举例说明这种融合研究范式,探讨生态学研究如何推动人工智能的发展(第 3 节)、人工智能如何推动生态学的发展(第 4 节),以及开展协同研究以加快相互发现和发展的机会(第 5 节)。最后,本文确定了人工智能和生态学学科应解决的一些不同和共同的偏见,并强调了一些共同的机会,以便更负责任地开发和部署人工智能(第 6 节)。

        1. 人工智能:技术现状

      在过去的 10 年中,深度神经网络(又称深度学习)因其强大的建模能力而成为人工智能的代名词。本文所熟知的成功案例包括:通过放射成像获得更准确的临床诊断,以及用于自动驾驶汽车技术的日益快速的分析和决策。2022 年 12 月,基于深度学习的语言模型 ChatGPT 显示了深度学习模型迅速扩展的潜力。深度神经网络是 ML 的一个子领域。ML 的智能来源于数据中的模式,无论是表格数据、时间序列、图像还是文本。其目标是将这些数据中的模式推广到新的未见数据点上。ML 模型有多种形式;有些较为简单,如决策树和线性模型,有些则较为复杂。例如,人工神经网络受到大脑神经元布线的启发,利用层级结构通过非线性函数计算加权点积。深度神经网络有很多层,并在大型数据集上进行训练。尽管最近人工智能中的 ML,尤其是深度学习大放异彩,但其他几种人工智能方法也在同步发展,它们可能会克服深度学习的局限性,为复杂系统建模,并实现更具弹性的智能。其中一个例子是符号人工智能,它涉及知识图谱的逻辑推理。知识图谱与统计数据不同,它明确捕捉概念及其语义关系。图中的顶点可能是 "动物"、"牛"、"植物 "和 "草",它们之间的边表示牛 "是 "动物,草 "是 "植物,牛 "吃 "草。然后,人工智能系统就可以推理出更广泛的概括,例如有些动物吃有些植物。知识图谱是符号人工智能中使用的一种表示方法。其他表示法包括本体、逻辑规则集、概率依赖图、微分方程和解析方程;每种表示法都有建立在其上的推理算法。这些知识和推理构成了专家系统。目前的人工智能技术是基于在难以想象的庞大数据集上训练出来的 "基础模型",这些数据集被用作许多不同任务的基础模型。在特定领域的小型数据集上进行微调的过程,可以使基础模型专门用于该任务。此外,基础模型还被用于生成模型中,生成模型能够创建新数据,例如,生成新病毒变体的序列和分子结构,从而研究人类和其他动物的感染风险假设。另一方面,神经符号人工智能结合了深度神经网络和基于知识的符号方法的优点,超越了每种方法的独特局限。神经符号人工智能系统被认为比狭隘的深度学习方法更宽泛,在通往 AGI 的道路上更进一步。它们可以帮助完成具有挑战性的知识发现任务(生成新假设),并处理不同模式、规模、质量和数量的异构复杂数据--所有这些在复杂系统的生态学研究中都很常见。与贝叶斯统计方法一样,神经符号人工智能也能在推理中纳入不同模式的专家知识,而这些知识并不总是以数据的形式呈现。与其他人工智能方法相比,神经符号人工智能还具有更强的适应性和鲁棒性,并能提供可解释的输出结果,从而提供机理上的洞察力,而这正是生态学研究的指导原则。

        2. 生态系统模拟

      生态系统的预测是复杂系统建模困难的缩影,复杂系统的定义是由跨越时间、空间和社会等多个尺度的反馈和依赖关系所产生的非线性动态。由于生态系统科学是多个成熟分支学科的交叉学科,许多物理和生物原理都可以指导我们对这些系统的理解--例如,水文学、生物地球化学和景观生态学的物理学原理,或种群动力学中的适应性原理。从对生态系统的观测中提取信息时,最好考虑到生态系统固有的随机性和环境依赖性。生态学家们采用了大量建模方法来应对这一挑战,其中一些方法侧重于系统的组成部分(例如,有限资源的分布和丰度受哪些生物物理因素控制等问题),而另一些方法则侧重于全局建模(例如,在快速变化的景观中,生态群落将如何发挥不同的功能?) 改进生态学中的系统级预测也可能对新型人工智能的发展大有裨益,而且这些创新可能比过去更快实现。在生态建模中,新计算方法的采用通常会滞后多年(图 2)。这方面的例子包括图论(如食物网建模)、线性回归(如遗传建模)、偏微分方程(如种群增长建模)、专家系统(如环境决策管理)、分层贝叶斯方法(如估算树木繁殖力)和深度学习(如评估生物多样性)。从发明一种计算方法到将其融入生态建模之间的历史滞后期似乎正在缩短(图 2),人工智能在生态建模中的应用大大增加(图 3)。在水文学、人畜共患病生态学和森林生态学等领域,基于 ML 的预测已开始补充理论驱动的预测。然而,人工智能的应用范围在很大程度上仍局限于模式识别和预测,人工智能作为一种工具仍未得到充分利用,例如,用于生态学大数据的综合或用于确定生态功能的新假说并确定其优先级以进行进一步研究。

▲图3 | 关键词为((TS=("artificial intelligence" OR "machine learning"))) AND WC=(Ecology OR "environmental sciences")Web of Science上的论文数量。

      与深度学习中受大脑启发而取得的突破类似,生物学的自组织特性和过程很可能隐藏着人工智能系统设计的灵感,人工智能研究与生态问题的紧密结合将揭示这些灵感。扩展这种生物学灵感提供了一个新的视角,突出了人工智能创新的机会,这些创新借鉴了从简单生物体(如粘菌)中经验观察到的智能决策,这些生物体违背了我们目前对 "智能 "的概念。同样,作为生物学和生态学基础的进化原理也为人工智能研究提供了灵感。进化计算是受生态学启发的人工智能分支,它应用遗传算法来指导系统进化,以实现应用目标,其进展源自硅学研究,如微生物的定向进化。符号回归是进化计算的另一种形式,目前通过在生态学中的应用得到了发展,从而产生了人类可解释的复杂生态系统函数方程模型,这些模型是由更原始的方程组成的。生态学中的生物多样性测量通常是生态系统复杂性的代用指标,它激励人工智能研究人员开发新的方法来测量训练数据中不必要的偏差。本文看好人工智能和生态研究之间的协同进步--生态理论有可能推动人工智能研究的前沿;现有的人工智能方法被注入复杂系统的生态建模中;人工智能和生态研究的共同成果有望实现关键的共同进步。

        3. 人工智能生态学:复原力理论

      在生态学中,复原力是指系统抵御干扰或从干扰中恢复的能力。生态系统之所以具有复原力,是因为其生态功能或系统成员所扮演的角色既是冗余的,又与环境有关。了解生态系统的恢复力是现代科学面临的最关键问题之一。我们在测量和预测系统恢复能力方面取得的进展,将决定我们能在多大程度上为全球气候变化和土地使用影响生物过程和高阶相互作用(生态系统恢复能力的基础)所带来的反响做好准备,并对这些影响做出响应。生态学中的复原力理论可为人工智能研究人员提供线索,帮助他们建立更稳健、适应性更强的系统,这些系统涉及反馈回路、冗余途径和满足行为,可确定系统的哪些基本原则最好能被量化和捕捉,以便再现复原力。这些人工智能系统本身可用于模拟和研究生态复原力。分布外泛化和对分布转移的复原力是人工智能研究的一个活跃领域。未来的人工智能技术可以模拟这种依赖于环境的行为,可能会受益于复杂的非线性互动和内置的鲁棒性。人工智能研究与生态学之间有目的的联合进展有可能扩展一般系统理论,受生态系统复杂性启发和制约的新型人工智能可作为通往其他领域(如心理学或经济学)的途径,在这些领域中,由于跨越多个相互作用尺度的复杂性,预测同样困难重重。

        4. 生态学人工智能:知识引导的 ML

      现有的深度学习算法都是数据饥渴型的,而且由于其架构不包含对所建模现象的先验知识,可能会产生与现实不一致的预测结果。不断发展的知识引导的 ML(KGML)领域是推动人工智能和生态学发展的一种方法,尤其是在数据稀缺的条件下,这在许多生态学领域仍然很常见。KGML 试图将科学知识注入 ML 算法的基础结构中,以帮助生成的模型做出更符合物理规律的预测。这种想法与贝叶斯统计方法中的先验知识是一致的,贝叶斯统计方法在生态学研究中也被用于类似目的,但往往受到数据需求和计算成本的限制。将知识指导注入 ML 模型的例子包括:定制损失函数以遵守物理定律;使用现有的 ML 架构(如长短期记忆(LSTM))或开发新的架构以更好地表示现实(如质量守恒-LSTM、递归图网络);使用基于过程的模型输出作为 ML 模型的输入或作为预训练数据集;在 ML 模型中使用偏微分方程表示系统;或将神经网络嵌入分层模型。展望未来,生态建模可能会激发更先进的架构,其中包括与层次结构、物理和生物定律以及微分方程相结合的先验本体知识,以及分散和新兴的训练范例。

        5. 通过人工智能与生态学的协同作用加速发现

      人工智能系统正开始从模式识别扩展到假设生成和发现,部分是通过揭示代表复杂系统的高维网络中变量之间缺失的联系。这些缺失的环节代表了跨越多个尺度的系统组件中未曾预料到的相互作用或依赖关系。生态系统中状态和过程的多样性和广度为提高人工智能能力提供了令人兴奋的潜力,以识别这些缺失环节并提出新的假设。人工智能与生态学之间的一个协同机会是在人工智能研究中被称为模式崩溃的问题,即算法无法捕捉多模式分布的全部多样性,因为建模必然集中在少数观察到的模式上。生态学和人工智能交替解决了这一长期存在的问题--扩散模型是生态学的起点,目前在生成式人工智能中成功解决了这一问题;但自那时以来,生态建模取得了巨大进步,电报模型、反应扩散模型和种群循环模型在解决生态系统的模式坍塌问题上不断取得进展。在这里,共同生成的研究对人工智能和生态学都有好处--一个相关的例子是,人工智能生成的关于多模式分布的假设有可能阐明是什么驱动了埃博拉病毒从野生动物宿主溢出传播的双峰。这种生成式人工智能将受益于先进的生态建模技术。与许多人工智能系统不同,生态系统是通过基于理论的规则来理解的。例如,我们对生物地球化学的理解建立在物理和化学、地质学、水文学以及生物学规则的基础之上。我们对种群如何随时间变化的理解建立在支持适应性概念的进化规则之上,而适应性是捕食者与猎物之间的相互作用、生物之间的竞争以及食物网结构的基础。然而,尽管基于理论的方法提供了对机制的理解,但可能不足以应对我们面临的生态危机。在人工智能研究中,基础建模也采用了类似的理念--即模式和预测的基础是规则,但与生态学不同的是,基础模型是通过利用大量可用数据,而不是通过数十年的科学方法,以算法的方式学习规则。强化学习是人工智能研究中另一个活跃的前沿领域,在这一领域中,这些规则被明确纳入,以生成关于系统如何随时间演变和稳定的假设。因此,尽管生态系统非常复杂,看似混乱不可预测,但管理规则,无论是源自理论还是数据,都为我们观察、解释和预测复杂生态系统的突发特性提供了锚点。这种方法尤其有望将复杂系统的社会维度纳入其中,因为社会维度对生态系统的影响历来未得到充分认识,而且仍然是一个跨学科的前沿领域。

        6. 负责任的人工智能与生态学

      行业在人工智能研究中日益占据主导地位,导致产品和平台不断改进,从而提供了有用的方法,而有关人工智能伦理和其他社会因素的研究却相对被忽视。然而,对安全、合乎伦理和负责任的人工智能的呼吁以及对减少偏见的方法的研究正在不断增加。本土、女权主义、非殖民主义和其他批判性视角为此类人工智能研究提供了基础,但这些视角仍处于人工智能的边缘,面临着认识论上的障碍,需要加以克服才能纳入主流人工智能研究。同样,生态学的历史根植于殖民主义;生态保护主义经常被用来为控制环境辩护;排斥性做法继续产生只对社会中享有特权的子集有利的推论。最近,生态学家正在努力发展将各种知识联系起来的做法,以更好地理解社会生态系统。例如,在获得知情同意并了解对社区的明确互惠利益的情况下获得的本土知识(又称传统生态知识)加强了生态学的研究方向,扩展到保护、负责任的管理、监管以及人与自然之间的关系伦理。例如,土著知识对北极积雪和海冰状况的细微了解被用来指导无人驾驶飞行器和卫星数据收集。这些信息被用来更好地了解和管理环斑海豹,这是一个在不断变化的气候中具有重要文化价值的物种。社会和文化结构的细微差别及其融合对于获得有关复杂系统的知识和智慧以及负责任地影响其未来至关重要。例如,系统性种族主义深刻影响了城市环境的社会、生态和进化特征,这对于确保社会公正和加强这些系统对气候变化的适应能力非常重要。至关重要的是,人工智能和生态学都要继续扩大认识论的界限,承认不同的认识方式在科学上是有效的,并尊重本土数据主权。为了成功做到这一点,两者都可以从社会科学的定性研究方法中学习,特别是要捕捉 "与土著认识论密不可分的背景,同时保持标准化的时间和表示参数,使其与其他数据集保持一致,以便进行整合和分析"(图 1 的层次图在各种认识论下都有争议)。此外,对土著数据遵循 CARE 原则(集体利益、控制权、责任和道德)有助于确保这些数据对土著人民有用,并始终处于他们的控制之下,同时还能促进人工智能和生态学知识的发展。 

       7. 展望融合

      研究事业一直沿着学科轨迹前进,人工智能与生态系统科学之间的重要融合正在快速接近。生物医学领域的融合研究凸显了人工智能在实现以往被称为 "登月计划 "的目标方面尚未实现的潜力--对尚未出现的传染性疾病和由多组相互作用因素引起的非传染性疾病的治疗。多方面的投资将有助于加速这种融合性突破:正视并改善目前存在的数据和认知方式中的偏见和局限性,考虑跨学科思维和实践以弥合知识构成中的哲学和伦理差异,以及在探索新的学科语言和视角的同时建立信任。对这种有意识的融合进行投资,有可能产生变革性的观点和解决方案,就像最近在聊天机器人和生成式深度学习方面取得的突破一样,具有超乎想象的颠覆性。在环境快速变化带来生存风险的时代,生态系统科学与人工智能之间的战略协同作用有助于推动我们更好地理解并有可能恢复我们赖以生存的生态系统的复原力。

      论文信息

      标题:A synergistic future for AI and ecology

      期刊:PNAS

      类型:Perspective 

      作者:Barbara A. HanKush R. Varshney..... ,  & Jacob Zwart【University of Vienna】

      时间:2023-10-10

      DOIhttps://doi.org/10.1016/j.soilbio.2023.109205