AiPaper
论文状态:已完成

Artificial Intelligence in Functional Food Ingredient Discovery and Characterisation: A Focus on Bioactive Plant and Food Peptides

发表:2021/11/19
原文链接
价格:0.10
已有 1 人读过
本分析由 AI 生成,可能不完全准确,请以原文为准。

TL;DR 精炼摘要

本文提出基于人工智能系统性挖掘和表征生物活性植物肽及食品肽,突破功能性食品成分发现中的传统低效和偶然性,推动高通量、精准识别天然活性成分,满足未被满足的健康需求,促进功能性营养产业发展。

摘要

Arti fi cial Intelligence in Functional Food Ingredient Discovery and Characterisation: A Focus on Bioactive Plant and Food Peptides Aoife Doherty † , Audrey Wall * † , Nora Khaldi and Martin Kussmann Nuritas Ltd., Dublin, Ireland Scienti fi c research consistently demonstrates that diseases may be delayed, treated, or even prevented and, thereby, health may be maintained with health-promoting functional food ingredients (FFIs). Consumers are increasingly demanding sound information about food, nutrition, nutrients, and their associated health bene fi ts. Consequently, a nutrition industry is being formed around natural foods and FFIs, the economic growth of which is increasingly driven by consumer decisions. Information technology, in particular arti fi cial intelligence (AI), is primed to vastly expand the pool of characterised and annotated FFIs available to consumers, by systematically discovering and characterising natural, ef fi cacious, and safe bioactive ingredients (bioactives) that address speci fi c health needs. However, FFI- producing companies are lagging in adopting AI technology for their ingredient development pipelines for several reasons, resulting in a lack o

思维导图

论文精读

中文精读

1. 论文基本信息

1.1. 标题

人工智慧在功能性食品成分发现与表征中的应用:以生物活性植物和食品肽为重点 (Artificial Intelligence in Functional Food Ingredient Discovery and Characterisation: A Focus on Bioactive Plant and Food Peptides)

1.2. 作者

  • Aoife Doherty (第一作者,Nuritas Ltd., Dublin, Ireland)

  • Audrey Wall (第一作者,Nuritas Ltd., Dublin, Ireland)

  • Nora Khaldi (Nuritas Ltd., Dublin, Ireland)

  • Martin Kussmann (Nuritas Ltd., Dublin, Ireland)

    通讯作者:Audrey Wall (wall.audrey@nuritas.com)

1.3. 发表期刊/会议

Frontiers in Genetics,具体章节为 Nutrigenomics。该期刊是遗传学领域的一个开放获取(Open-Access)学术期刊,在相关领域具有一定的影响力,旨在发表高质量的同行评审研究。

1.4. 发表年份

2021年

1.5. 摘要

科学研究持续表明,通过具有健康促进功能性食品成分(FFIs),疾病可以被延缓、治疗甚至预防,从而维护健康。消费者越来越要求获得关于食物、营养、营养素及其相关健康益处的可靠信息。因此,一个围绕天然食品和FFIs的营养产业正在形成,其经济增长日益受到消费者决策的驱动。信息技术,特别是人工智慧(AI),正准备通过系统地发现和表征针对特定健康需求的天然、有效且安全的生物活性成分(bioactives),从而极大地扩展可供消费者使用的已表征和已注释的FFIs库。然而,FFI生产公司由于多种原因,在将其成分开发流程中采纳AI技术方面进展缓慢,导致缺乏大规模和高通量分子及功能性成分表征的有效手段。AI主导的技术革命的到来,使得对FFI分子世界的全面表征和理解成为可能,从而以前所未有的方式挖掘食品和天然产物空间。反过来,这种生物活性成分的扩展极大地增加了消费者可用的FFIs种类,最终导致生物活性成分被专门开发以满足未被满足的健康需求。

1.6. 原文链接

/files/papers/690da4a8caf476a8987aeb0d/paper.pdf 状态:已正式发表。

2. 整体概括

2.1. 研究背景与动机

  • 核心问题: 传统上,功能性食品成分(FFIs)的发现和表征过程是偶然的(serendipitous)、低效的、耗时的,并且难以进行大规模和高通量的分子及功能性表征。这导致了市面上真正具有变革性、疾病改善和健康维护作用的FFIs数量有限。
  • 重要性: 随着消费者对健康、营养和天然食品益处的关注度日益增加,以及生活方式相关慢性疾病(如糖尿病、肥胖)日益成为公共健康负担,对能够预防和干预这些疾病的FFIs的需求显著增长。传统的“一种疾病一种药物靶点”的制药模式难以可持续地解决这些慢性病问题,需要营养干预作为补充策略。
  • 现有挑战或空白:
    1. 传统发现的偶然性: 许多重要生物活性成分的发现是偶然的,耗费数十年和巨额资金。
    2. 表征效率低下: 对FFIs的生化和生物学表征不完整,需要昂贵且专业的仪器和方法,且多为“一次性”方法,缺乏通用性和高通量能力。
    3. 复杂性: 天然产物中包含数百万种化合物,且食品基质(food matrix)效应使得单一生物活性成分的效果难以分离和验证。
    4. 行业采纳滞后: FFI生产公司在将人工智慧(AI)技术整合到其开发流程中方面进展缓慢。
    5. 缺乏标准化: 营养干预研究之间缺乏可比性,部分原因是没有统一的饮食和研究设计标准。
  • 论文切入点与创新思路: 论文提出并倡导将AI技术整合到FFI的发现和表征流程中。通过将AI置于整个过程的前端,改变了从“生物活性已建立后才分配健康益处”的传统模式,转向“从预定义的健康益处和消费者需求出发进行设计”的新范式。特别关注生物活性植物和食品肽(bioactive plant and food peptides)。

2.2. 核心贡献/主要发现

  • 提出了AI驱动的FFI发现和表征新范式: 将AI置于传统流程前端,实现了从偶然发现和回顾性效益分配向针对性设计和预测的转变。
  • 详细阐述了AI整合肽组学的流程: 展示了如何将大规模质谱(mass spectrometry)肽组学数据与公共领域信息、内部验证数据结合,通过深度学习(deep learning)预测具有特定生物活性的肽。
  • 展示了AI在加速FFI开发中的潜力: 通过案例研究(抗炎FFI和肌肉健康FFI)证明了AI能够显著缩短从发现到商业化的时间(例如,抗炎FFI仅需约2年),并扩展发现空间至整个植物和食品领域。
  • 强调了“循环科学:迭代反馈循环”(Circular Science: The Iterative Feedback Loop)的重要性: 预测的肽经过合成和体外(in vitro)验证,其结果反过来持续优化AI模型,形成一个高效的、自我改进的发现系统。
  • 强调了AI在解决具体健康需求方面的能力: 能够根据预定义的消费者健康需求(如抗炎、肌肉健康)或食品链相关替代需求,有针对性地发现和开发FFIs。

3. 预备知识与相关工作

3.1. 基础概念

  • 功能性食品成分 (Functional Food Ingredients, FFIs): 指那些除了提供基本营养外,还具有特定健康益处(如预防疾病、促进健康)的食品成分。这些成分通常是天然存在于食品中,或通过加工添加到食品中。
  • 生物活性成分 (Bioactives): 泛指在生物体内能够产生特定生理效应的物质。在本文中,特别指具有健康促进作用的天然化合物。
  • 生物活性肽 (Bioactive Peptides): 通常指包含2到20个氨基酸残基的短链蛋白质片段。它们通过酶解(enzymatic hydrolysis)从母体蛋白质中释放出来,并表现出多种生物学功能,如抗高血压、抗氧化、抗炎、免疫调节等。
  • 人工智慧 (Artificial Intelligence, AI): 指由机器展现出的智能,能够感知环境、进行推理、学习、理解语言、解决问题和做出决策。在本文中,AI主要用于处理和分析大量生物数据,以预测和发现新的生物活性成分。
  • 机器学习 (Machine Learning, ML): AI的一个子领域,通过算法使计算机系统从数据中学习,而无需进行明确的编程。它通过识别数据中的模式和关系来做出预测或决策。
  • 深度学习 (Deep Learning): 机器学习的一个分支,使用多层人工神经网络(称为深度神经网络)从海量数据中学习复杂的模式。在本文中,深度学习用于处理肽序列数据,预测其生物活性。
  • 高通量筛选 (High-Throughput Screening, HTS): 一种自动化实验方法,可以在短时间内对大量化合物或样本进行快速测试,以识别具有特定生物活性的分子。
  • 肽组学 (Peptidomics): 大规模研究肽的科学领域,包括识别、量化、表征和分析生物样本中所有肽的集合(肽组)。它利用质谱技术进行肽的序列鉴定和定量。
  • 生物信息学 (Bioinformatics): 结合生物学、计算机科学和统计学,开发和应用计算工具来处理、分析和解释生物数据(如基因序列、蛋白质结构、肽序列)。
  • 质谱 (Mass Spectrometry, MS): 一种分析化学技术,通过测量离子的质荷比(mass-to-charge ratio)来鉴定、定量或表征分子。液相色谱-质谱/质谱 (LC-MS/MS) 是将液相色谱的分离能力与串联质谱的鉴定和定量能力结合的技术,非常适合复杂生物样本中肽的分析。
  • 食物基质 (Food Matrix): 指食品中所有成分(如蛋白质、脂肪、碳水化合物、纤维等)的结构和组成,以及它们之间的相互作用。食物基质会影响生物活性成分的生物利用度(bioavailability)和生物功效(bioefficacy)。

3.2. 前人工作

  • 传统FFI发现的偶然性:
    • 维生素(Vitamins)的发现和确立历时数十年(20世纪),耗费巨大财政资源。通常是观察到某种疾病与营养素缺乏相关联,从而推断出该营养素的重要性(例如,坏血病与维生素C缺乏)。
    • 人类母乳低聚糖(Human Milk Oligosaccharides, HMO)的发现始于1930年代,但其益处(调节肠道微生物群、抗病原体粘附、免疫系统调节)直到近几年才通过大量研究被确凿证明。
    • 这些例子都表明传统发现过程是偶然的(serendipitous),而非系统性的。
  • 高通量筛选(HTS)的出现:
    • HTS是生物活性化合物发现领域的第一次重大技术革命。它结合了微型化和多重分离技术、自动化液体处理(机器人技术)、更灵敏的检测技术(如质谱)以及先进的生物信息学和计算技术。
    • 在药物发现领域取得了显著成功。
    • 但对于食品生物活性成分,其在HTS中的产出有限,因为食品生物活性成分通常协同作用,且受食物基质影响,难以分离纯化后仍保持原有活性。
  • 传统FFI表征的挑战:
    • 分析挑战: 需要昂贵和专业的仪器(如LC-MS/MS、ICP-MS/MS),方法通常是“一次性”的,缺乏通用性和高通量能力。
    • 生化和生物学挑战: 天然来源中数百万种化合物的解缠结非常复杂;即使识别出潜在的生物活性成分,评估其稳定性、生物利用度、功能归属和体内外验证也十分困难。食品生物活性成分通常产生多重、微妙、长期的协同效应,而非单一、强烈、即时效应,这使得“纯化”化合物反而可能减弱其效应。

3.3. 技术演进

该领域的技术演进可以概括为以下几个阶段:

  1. 偶然发现阶段: 基于观察和经验,耗时长,效率低,如维生素和HMOs的早期发现。
  2. 高通量筛选(HTS)阶段: 引入自动化和更灵敏的分析技术(如质谱),提高了筛选效率,主要应用于药物发现。但对于食品生物活性成分,因其复杂性(多成分协同、食物基质效应),效果有限,仍主要用于“发现后验证”。
  3. 生物信息学整合阶段: 利用计算工具(如BLAST)从已知数据中进行序列相似性搜索,辅助蛋白质和肽的识别。但仍主要依赖已知数据,无法进行从头(de novo)预测。
  4. 人工智慧(AI)驱动阶段(本文重点): 结合深度学习、肽组学和多源数据,实现对生物活性肽的从头预测和针对性设计。这标志着从“筛选和回顾性效益分配”向“根据预定义益处进行设计”的范式转变,大大加速了FFI的发现和表征过程。

3.4. 差异化分析

本文的方法与相关工作中的主要方法相比,核心区别和创新点在于:

  • 范式转变:
    • 传统方法 (如图1所示): 遵循“食材分馏 → 生物活性筛选 → 活性组分鉴定 → 成分鉴定 → 功能性成分表征 → 效益赋值”的流程。这是一种“由下而上”(bottom-up)、偶然性高、反应式的模式,即先发现活性,再寻找应用。
    • AI驱动方法 (如图2所示): 遵循“益处定义 → 生物活性预测 → 食物来源识别 → 生物活性释放 → 生物活性验证”的流程。这是一种“由上而下”(top-down)、目标导向、主动式的模式,即首先定义健康益处和消费者需求,然后利用AI预测和设计相应的生物活性成分。
  • 发现效率:
    • 传统方法:耗时数十年,成本高昂,产量有限。
    • AI驱动方法:显著加速发现和验证过程(例如,从发现到商业发布仅需约2年),大幅减少需实验表征的候选数量。
  • 发现空间:
    • 传统方法:受限于实验筛选的范围和食品基质的复杂性。
    • AI驱动方法:通过预测功能和来源,将发现空间扩展到整个植物和食品王国,特别是对于基因编码的肽类。
  • 迭代优化:
    • 传统方法:缺乏系统性的反馈循环来持续改进发现过程。
    • AI驱动方法:建立了“循环科学:迭代反馈循环”(如图3所示),将实验验证(体外功效、安全性、稳定性)结果反馈给AI模型,不断提高预测准确性。
  • 分子层面理解:
    • 传统方法:难以全面解缠结和表征天然产物中数百万种化合物的复杂网络。
    • AI驱动方法:通过深度学习对肽库进行分类,推断毒性、溶解度、大小、极性、结合动力学等特性,实现对FFI分子更全面的表征和理解。

4. 方法论

4.1. 方法原理

该论文提出了一种以人工智慧(AI)为核心的功能性食品成分(FFI)发现和表征新范式。其核心思想是将AI技术置于传统发现流程的前端,从而实现从被动的、偶然性的“筛选和回顾性效益分配”转向主动的、目标导向的“根据预定义益处进行设计”。这种方法利用AI处理海量多源数据,预测具有特定生物活性的肽序列,并指导FFI的来源选择、酶解释放和后续验证,最终形成一个迭代优化的“循环科学”流程。

4.2. 核心方法详解

论文描述的AI驱动的功能性食品成分发现和验证工作流程,可以概括为以下几个关键阶段,并通过 Figure 2 和 Figure 3 进行了可视化。

4.2.1. AI驱动的发现与后续验证工作流程

这个流程颠覆了传统的发现模式,从预先定义健康益处和消费者需求开始,而非偶然发现活性后再寻找应用。

  1. 益处定义 (Benefit Definition):

    • 目的: 明确消费者未被满足的营养健康需求或食品链中的特定替代需求。
    • 操作: 这是一个商业和健康策略层面的起始点,指导后续的AI预测方向。例如,需要开发具有抗炎效果的FFI,或者需要用天然成分替代食品添加剂。
  2. 生物活性预测 (Bioactive Prediction):

    • 目的: 基于定义的益处,利用AI预测具有相应生物活性的肽序列。
    • 操作:
      • 数据整理 (Data Curation): 收集来自结构化(如数据存储库)和非结构化(如科学文献、专利)公共领域数据。这些数据包含了已知具有相关生物活性的肽序列信息。
      • 整合肽组学数据 (Integration with Peptidomics): 将上述公共数据与内部进行的大规模质谱(LC-MS/MS)肽组学研究数据相结合。这些肽组学数据来自各种植物和食品来源,识别并量化了其天然状态下的肽。
      • 内部验证数据 (In-house Validation Data): 结合内部实验室进行的相关生物活性测定中获得的肽功效验证数据。这些数据构成了AI训练的“真值”。
      • 训练数据集构建 (Building Training Datasets): 手动整理上述数据,构建训练数据集。通常包含两部分:
        • 正向数据集 (Positive Bioactive Datasets): 肽序列已被证明对特定活性有效(来自文献、数据库或内部测定)。
        • 负向数据集 (Negative Datasets): 肽序列未表现出特定生物活性。若缺乏负向数据,可使用随机序列作为负向样本。
      • 算法架构训练 (Algorithmic Architecture Training): 使用整理好的正向和负向数据集作为输入,训练深度学习(deep learning)模型。这些模型学习肽序列与特定生物活性之间的复杂模式,以预测给定生物活性的潜在肽。
        • 肽特征提取: AI模型会从肽序列中学习物理化学特征,如分子量、电荷、长度、疏水性等,以及其他通过深度学习推断出的特性,如毒性、溶解度、极性、结合动力学等。
        • 分类与预测: 将肽库(peptide libraries)分类为不同的结构和功能类别,并预测其潜在的生物活性。
  3. 食物来源识别 (Food Source Identification):

    • 目的: 在预测出具有所需生物活性的肽后,识别哪些天然植物或食物蛋白质组中含有这些肽。
    • 操作: AI在自然界(植物和食物蛋白质组)中搜索预测出的阳性肽的存在。这种基因组编码的肽类是AI能够有效扩展发现空间的原因。
  4. 生物活性释放 (Bioactive Release):

    • 目的: 从识别出的食物来源中,通过可控的酶解过程,高效地释放出目标肽。
    • 操作: AI指导酶解工艺的设计,包括选择食品级的酶。通过对母体蛋白质进行酶解,生成具有所需肽谱(peptide profile)的水解产物。
  5. 生物活性验证 (Bioactive Validation):

    • 目的: 验证由AI预测并从食物来源中释放出的FFI的功效、安全性和稳定性。
    • 操作:
      • 体外功效验证 (In vitro Efficacy Validation): 对生产出的FFI进行体外(in vitro)测试,验证其生物活性。
      • 安全性与毒性评估 (Safety and Toxicity Assessment): 使用细胞活力测定等方法评估预测肽和FFI的安全性及毒性。
      • 稳定性评估 (Stability Assessment): 评估肽在口服摄入和胃肠道消化过程中的稳定性(如胃肠道抵抗力)。
      • 生物利用度预测 (Bioavailability Prediction): 虽然论文指出这仍是未来AI应用的方向,但当前AI已能预测肽的胃肠道抵抗力。通过体外和离体(ex vivo)模拟消化实验,有望识别关键潜在特征,从而预测生物活性肽和FFI的生物利用度(包括肠腔转运、血浆稳定性和靶组织可及性)。

4.2.2. 循环科学:迭代反馈循环 (Circular Science: The Iterative Feedback Loop)

这个概念是AI驱动方法的核心优势之一,如图3所示:

  • 迭代过程: 整个流程是一个持续迭代的反馈循环。

  • 数据生成与模型优化:

    • AI预测出的单个生物活性肽会被化学合成,并在体外(in vitro)进行功效验证,以阐明其作用机制。
    • 这些验证结果(无论是阳性还是阴性)都会被收集起来,作为新的数据反馈给深度学习算法。
    • 这种持续的反馈不断地细化和改进AI模型,从而提高生物活性肽预测的准确性。
  • 全面评估: 除了生物活性反馈,对预测肽和FFI的安全性、毒性、以及口服摄入和胃肠道消化过程中的稳定性也会进行评估(例如,使用细胞活力测定和体外消化模型)。这些结果也被纳入迭代学习过程。

  • 最终产品: 通过这种AI方法开发出的FFI,具有高生物功效、良好的安全特性,并带有一个预先批准的关键组成肽列表,这些肽已在体外合成和验证了其预测的活性。

    以下是 Figure 2 和 Figure 3 的图像,分别展示了AI整合到发现流程中的高层概述以及详细的迭代反馈循环。

    该图像是一个流程示意图,展示了功能性食品成分发现和表征中的关键步骤,依次为“益处识别”、“生物活性预测”、“食物来源识别”、“生物活性释放”和“生物活性验证”。 该图像是一个流程示意图,展示了功能性食品成分发现和表征中的关键步骤,依次为“益处识别”、“生物活性预测”、“食物来源识别”、“生物活性释放”和“生物活性验证”。

图2:将AI整合到天然生物活性发现和表征流程中。该图展示了一个循环过程,从“益处识别”开始,通过“生物活性预测”、“食物来源识别”和“生物活性释放”,最终通过“生物活性验证”来确认益处。

FIGURE 3aop cn iatve aeagrene 该图像是一个示意图,展示了功能性食品成分(FFIs)生物活性肽的发现平台的迭代改进过程,涵盖消费者需求、人工智能预测、制造与测试四个步骤,强调持续循环优化以实现健康益处。

图3:功能性食品成分(FFIs)生物活性肽的发现平台的迭代改进过程。该图展示了一个循环流程,从“消费者需求”出发,经过“AI预测”,进入“制造与测试”环节,并通过“反馈循环”不断优化AI模型,以持续实现“健康益处”。

5. 实验设置

论文并未进行单一的、统一的实验设置来评估一个AI模型的性能,而是通过两个案例研究来阐述AI驱动的发现流程如何应用于实际问题。因此,本节将根据案例研究中提及的信息进行归纳。

5.1. 数据集

  • 公共领域数据:
    • 结构化数据 (Structured data): 主要指各种数据存储库(data repositories),其中包含已知的肽序列及其相关的生物活性信息。
    • 非结构化数据 (Unstructured data): 主要指大量的科学出版物(publications)和专利(patents),这些文本信息中蕴含着对已知肽序列及其生物活性的描述。
  • 专有肽组学数据 (Proprietary peptidomic data):
    • 通过液相色谱-串联质谱 (LC-MS/MS) 技术,对各种植物和FFI进行肽组学研究,识别和量化其天然状态下的肽。这些数据包括肽的分子量、电荷、长度和疏水性等物理化学特征,形成庞大的内部肽库。
  • 内部实验筛选数据 (Internal experimental screening data):
    • 来源于内部实验室进行的生物活性测定(bioactivity assays)的表型数据。这些数据用于训练AI模型,作为肽功效的真实标注数据 (Ground Truth)

      这些数据集被整合并手动整理,以构建用于训练深度学习 (deep learning)模型的正向数据集 (positive bioactive datasets)(已知有效肽序列)和负向数据集 (negative datasets)(无效或随机肽序列)。

5.2. 评估指标

论文中并未明确列出用于AI模型训练或评估的标准化数学评估指标(如准确率、F1分数等),而是聚焦于其发现的FFI在生物学和临床层面的“功效”和“健康益处”。以下是案例研究中提及的关键评估维度及其概念定义:

5.2.1. 概念定义

  1. 生物功效 (Bioefficacy): 指生物活性成分在体内或体外产生预期生物学效应的能力。
    • 抗炎功效 (Anti-Inflammatory Efficacy): 衡量成分减轻炎症反应的能力。在案例研究中,具体通过抑制肿瘤坏死因子-α (TNF-α)的循环水平来评估。TNF-α是一种重要的促炎细胞因子。
    • 肌肉健康功效 (Muscle Health Efficacy): 衡量成分促进肌肉蛋白质合成和/或减少肌肉萎缩的能力。在案例研究中,具体通过增加核糖体蛋白S6磷酸化 (S6 phosphorylation)(与蛋白质合成相关)和减少炎症(TNF-α)来评估。
  2. 安全性 (Safety) 和 毒性 (Toxicity): 评估成分在推荐剂量下对细胞或生物体是否无害。通常使用细胞活力测定 (cell viability assays)
  3. 稳定性 (Stability): 衡量成分在不同条件(如消化环境)下保持其结构和活性的能力。
    • 胃肠道抵抗力 (Gastrointestinal Resistance): 评估肽在模拟胃肠道消化过程中不被降解的能力。
  4. 生物利用度 (Bioavailability): 指生物活性成分被摄入后,在体内被吸收并到达靶组织(或血液循环)的程度和速率。涉及以下方面:
    • 肠腔转运 (Transport properties from the gut lumen): 评估成分从肠腔穿过肠壁进入血液循环的能力。
    • 血浆稳定性 (Stability in human plasma): 评估成分在血液中不被降解的稳定性。
    • 靶组织可及性 (Availability in the target tissue): 评估成分到达特定靶组织并发挥作用的能力。

5.2.2. 数学公式与符号解释

论文中未提供这些评估指标的标准化数学公式。在实际研究中,这些指标通常通过生物化学检测、细胞实验和临床试验数据来量化,并可能涉及复杂的统计分析来确定其显著性。例如:

  • TNF-α 减少百分比: (TNFα对照TNFα实验TNFα对照)×100%( \frac{TNF\alpha_{\text{对照}} - TNF\alpha_{\text{实验}}}{TNF\alpha_{\text{对照}}} ) \times 100\%
    • TNFα对照TNF\alpha_{\text{对照}}:对照组中 TNF-α 的水平。
    • TNFα实验TNF\alpha_{\text{实验}}:实验组中 TNF-α 的水平。
  • S6磷酸化 增加百分比: (S6磷酸化,实验S6磷酸化,对照S6磷酸化,对照)×100%( \frac{S6_{\text{磷酸化}, \text{实验}} - S6_{\text{磷酸化}, \text{对照}}}{S6_{\text{磷酸化}, \text{对照}}} ) \times 100\%
    • S6_{磷酸化, 实验}:实验组中 S6 磷酸化水平。
    • S6_{磷酸化, 对照}:对照组中 S6 磷酸化水平。
  • 细胞活力: 通常通过比色法(如MTT、CCK-8)或荧光法测定,结果以相对百分比表示,数学公式依赖于具体试剂盒。
  • 肽稳定性: 通过液相色谱-质谱 (LC-MS) 追踪特定肽在不同时间点的浓度,计算降解率。

5.3. 对比基线

论文没有明确指出AI方法与特定基线模型(Baselines)的量化性能比较。然而,其主要对比隐含在对“传统发现和表征方法”的批判中,以及通过案例研究展示AI带来的“加速”和“效率提升”。

  • 传统发现方法: 主要指偶然发现(serendipitous discovery),耗时数十年(如维生素、HMOs),成本高昂,且缺乏系统性和高通量能力。

  • 高通量筛选(HTS)方法: 虽然引入了自动化和效率,但对于食品生物活性成分的复杂性(协同作用、食物基质效应)仍有局限性,并且依然是“发现后寻找应用”的模式。

    AI驱动方法的优势在于其能够:

  • 加速流程: 案例研究中,抗炎FFI从发现到商业发布仅用了约2年,这与传统方法(如HMOs研究了一个世纪)形成鲜明对比。

  • 目标导向: AI能够根据预定义的健康益处进行设计,而不是偶然发现。

  • 扩展发现空间: 利用基因组信息和预测能力,探索整个植物和食品领域。

    因此,AI方法的主要“优势对比”体现在发现效率、时间成本、发现广度以及从被动到主动的范式转变上。

6. 实验结果与分析

论文通过两个具体的案例研究,展示了人工智慧(AI)在生物活性肽的发现和表征中的实际应用和显著优势。

6.1. 核心结果分析

6.1.1. 抗炎功能性食品成分(FFI)的发现

  • 研究目的: 识别和表征新型抗炎生物活性肽,以解决慢性低度炎症问题。
  • AI方法应用:
    • 整合了深度学习 (deep learning)模型集合,分析了非结构化(文献、专利)和结构化(数据存储库)的公共数据。
    • 结合了专有的肽组学数据、分子对接模拟以及内部实验筛选的表型数据。
    • 通过非靶向预测方法 (untargeted predictive approach),从大量植物源肽序列中预测出具有免疫调节潜力的肽。
  • 主要发现与验证:
    • 来源识别: 亚洲大米(Asian rice)被识别为含有新型预测免疫调节肽的候选来源。这些肽“加密”(encrypted)在亚洲大米蛋白质中。
    • FFI设计与制备: 从亚洲大米的大量蛋白质组分中设计并制备了一种水解产物,命名为大米天然肽网络 (rice Natural Peptide Network, NPN)
    • 体外验证: 大米NPN 含有七种关键的组成生物活性肽,这些肽经过物理化学表征,并在体外(in vitro)显示出免疫调节作用。
    • 人体试验(概念验证): 在针对表现出“炎症衰老”(inflammaging,即免疫衰老)的老年人群进行的人体喂养试验和动态人体试验中,大米NPN 显著降低了循环中肿瘤坏死因子-α (TNF-α)的水平,并改善了一系列挑战(如坐站测试)中的身体机能。
  • 影响力: 从发现到商业发布仅用了大约2年时间,这突显了AI驱动的生物活性食品肽发现和表征过程在解决消费者需求方面的速度和效率。

6.1.2. 肌肉健康功能性食品成分(FFI)的表征

  • 研究目的: 表征一种已知的FFI(来自蚕豆 Vicia faba 的NPN_1水解产物),识别其组成生物活性肽及其靶向功能。
  • AI方法应用:
    • AI被用于表征已知的FFI或植物/食物来源,以识别具有特定功能的组成生物活性成分(“从来源到益处”的方法)。
    • 预测了NPN_1中的两个组成肽能够增加蛋白质合成和减少炎症。
  • 主要发现与验证:
    • 体外功效验证: 预测的肽在体外实验中显示出积极作用:
      • 增加核糖体蛋白S6磷酸化 (ribosomal protein S6 phosphorylation),这与诱导肌肉蛋白质合成相关。
      • 减少肿瘤坏死因子-α (TNF-α),这与慢性炎症和骨骼肌功能障碍相关。
    • 生物利用度评估: 考虑到FFI的生物利用度对其生物功效至关重要,Corrochano等(2021)的研究在体外(in vitro)证明:
      • 这两种具有预测活性的肽在模拟胃肠道消化中存活了下来。
      • 它们能够穿过肠道屏障进行转运。
      • 在人体血浆中表现出显著的稳定性。

6.1.3. AI带来的游戏规则改变者影响

这两个案例研究共同说明了AI在肽基FFI发现和表征中的游戏规则改变者 (game-changing)影响:

  • 扩展发现空间: AI能够将发现范围扩展到整个植物和食物王国,因为肽是基因编码营养素中最大的一类,易于进行功能和来源预测。
  • 定向发现: 根据预定义的、未满足的消费者需求(无论是医疗保健相关还是食品链相关)指导发现过程。
  • 加速过程: 通过快速开发和改进预测器,以及高效的预测-实验反馈循环,加速发现和后续验证过程。
  • 减少候选数量: 显著减少需要进行生化和生物学表征的候选肽数量。
  • 指导临床试验和健康声明: 为临床试验设计和FFI的健康声明提供信息。
  • 构建知识库: 有效地构建基于肽的FFI知识库,为生产者和消费者提供信息,推动食品创新,增强科学支持的营养健康益处。

6.2. 数据呈现 (表格)

原文中没有提供实验结果的表格数据。

6.3. 消融实验/参数分析

论文中没有描述具体的消融实验或参数分析。案例研究主要侧重于展示AI驱动流程的整体有效性和效率,而非AI模型内部组件的贡献或超参数的影响。

7. 总结与思考

7.1. 结论总结

该论文明确指出,人工智慧(AI)正在引领营养技术进入一个新时代,将传统上缓慢、偶然且低效的功能性食品成分(FFI)发现和表征流程转变为一个快速、目标导向且高效的系统。通过将AI置于整个发现过程的前端,研究人员可以从预定义的健康需求出发,系统地预测、识别、释放和验证具有特定生物活性的肽类FFIs。这不仅极大地扩展了可供消费者选择的FFIs种类,加速了新产品的上市(例如,从发现到商业发布仅需约2年),而且能够精确地针对未被满足的健康需求开发定制化的营养干预方案。最终,AI在FFI领域的应用将推动营养和食品行业向更安全、可持续、以知识为基础的健康解决方案迈进,从而改善人类和动物的健康。

7.2. 局限性与未来工作

论文作者指出了一些局限性并提出了未来工作方向:

  • 生物利用度预测的深化: 虽然目前的AI架构能够预测肽的胃肠道抵抗力 (gastro-intestinal resistance),但仍需进一步的体外(in vitro)和离体(ex vivo)模拟胃肠道消化和稳定性实验,以识别关键的潜在特征。这将有助于未来的AI应用能够更全面地预测生物活性肽和FFI的生物利用度(包括全身性和靶组织水平)
  • 知识库的持续构建: 论文强调AI将高效地构建基于肽的FFI知识库,这暗示了这是一个需要持续投入和扩展的工作。

7.3. 个人启发与批判

7.3.1. 个人启发

  • 范式转变的巨大潜力: AI从“筛选与回顾性效益分配”到“根据预定义益处进行设计”的范式转变,不仅适用于FFI,也对药物发现、材料科学等领域具有启发意义。它意味着我们可以更主动、更高效地解决特定问题,而不是等待偶然发现。
  • 迭代反馈循环的重要性: 循环科学 (Circular Science) 的概念非常强大,它强调了实验验证结果对AI模型持续优化的关键作用。这种紧密的AI-实验闭环是确保模型准确性和鲁棒性的核心,也是实现快速创新的关键。
  • 多源数据融合的价值: 论文通过整合公共领域数据、专有肽组学数据和内部验证数据,构建了丰富的数据基础。这表明在复杂科学问题中,仅仅依赖单一数据源是不足的,多模态数据的有效融合是AI发挥其威力的前提。
  • 个性化营养的未来: 随着AI对FFI更深入的理解和发现,未来有望实现高度个性化的营养干预方案,根据个体基因、健康状况和需求定制功能性食品,从而真正实现预防医学的愿景。
  • 解决全球健康挑战: 针对慢性病和炎症衰老等全球性健康问题,AI驱动的FFI发现提供了一个非药物、更可持续的解决方案,减轻了公共卫生负担。

7.3.2. 批判

  • AI“黑箱”问题与监管挑战: 深度学习模型通常是黑箱 (black box),其内部决策过程难以解释。在食品和健康产品领域,透明度和可解释性对于监管机构的批准和消费者的信任至关重要。如何有效地解释AI的预测结果,并将其转化为可接受的科学证据,是一个需要解决的挑战。
  • 食品基质复杂性的简化: 论文主要关注肽类生物活性成分,并承认食物基质 (food matrix)对生物利用度和生物功效的影响。然而,AI模型在多成分协同作用和复杂的食物基质效应方面的预测能力仍有待深入探讨。目前的案例主要聚焦于单个或少量关键肽的作用,但天然食品的整体功效往往是多种成分复杂相互作用的结果。
  • 体外验证到体内功效的转化: 尽管论文强调了体外验证,但体外结果向复杂体内环境(包括人体临床试验)的转化仍然是最大的挑战和耗时环节。AI虽然能加速发现,但最终的生物功效 (bioefficacy)生物利用度 (bioavailability)仍需昂贵且漫长的临床验证。论文中的人体试验案例也主要是概念验证性质。
  • 数据质量与偏差: AI模型的性能高度依赖于训练数据的质量和广度。公共领域数据可能存在偏差、不完整或异质性。专有肽组学数据的生成也需要高质量的样本和严谨的实验设计。如果训练数据存在偏差,AI的预测也可能继承这些偏差,甚至产生幻觉 (hallucination)
  • 伦理和社会经济影响: 随着AI在营养领域的深入,个性化或AI驱动的FFI可能带来伦理问题,如数据隐私、健康信息的滥用。此外,这些高端、定制化的FFI成本可能较高,如何确保其可负担性和公平可及性,避免加剧健康不平等,也是一个需要思考的问题。
  • 版权与专利问题: AI系统整合了大量公共数据(文献、专利)和专有数据。在AI发现新的生物活性成分时,其知识产权归属和专利申请可能变得更加复杂。

相似论文推荐

基于向量语义检索推荐的相关论文。

暂时没有找到相似论文。