论文状态:已完成

RNA stability enhancers for durable base-modified mRNA therapeutics

发表:2025/11/07
原文链接
价格:0.10
已有 2 人读过
本分析由 AI 生成,可能不完全准确,请以原文为准。

TL;DR 精炼摘要

本研究筛选了196,277个病毒序列,识别出11种能显著增强mRNA稳定性和翻译的RNA稳定性增强剂。这些元素通过招募TENT4延长poly(A)尾,降低去腺苷酸化,提高mRNA的耐久性。特别是元素A7在不同条件下表现优异,实现了与环状RNA相当的稳定性及更高的翻译效率,为新型mRNA疗法的开发奠定了基础。

摘要

Nature Biotechnology nature biotechnology https://doi.org/10.1038/s41587-025-02891-7 Article RNA stability enhancers for durable base-modified mRNA therapeutics Soo-Jin Jung 1,2,5 , Jenny J. Seo 1,2,4,5 , Sunghan Lee 1,2,5 , Seong-In Hyun 1,2 , Ji-eun Lee 1,2 , Sojeong Lee 1,2 , Yeji Lee 3 , Hyeshik Chang 1,2 , Hyukjin Lee 3 , Jin-Hong Kim 1,2 & V. Narry Kim 1,2 The limited stability of mRNA in vivo remains a major challenge for vaccines and therapeutics. While alternative RNA formats such as circular RNA or self-amplifying RNA offer greater durability, these modalities often suffer from low translation, modification incompatibility and difficult manufacturing. To overcome these limitations, we screen 196,277 viral sequences and identify eleven elements …

论文精读

中文精读

1. 论文基本信息

1.1. 标题

RNA stability enhancers for durable base-modified mRNA therapeutics (用于持久性碱基修饰mRNA疗法的RNA稳定性增强剂)

1.2. 作者

Soo-Jin Jung, Jenny J. Seo, Sunghan Lee, Seong-In Hyun, Ji-eun Lee, Sojeong Lee, Yeji Lee, Hyeshik Chang, Hyukjin Lee, Jin-Hong Kim & V. Narry Kim。 作者们主要隶属于韩国科学技术院(Institute for Basic Science)和首尔国立大学(Seoul National University)。

1.3. 发表期刊/会议

Nature Biotechnology。 Nature Biotechnology 是一本在生物技术领域享有极高声誉和影响力的同行评审科学期刊,专门发表生物技术及其相关领域的原创研究、评论和观点。该期刊的发表通常代表着该领域的重要突破和前沿进展。

1.4. 发表年份

2025年。

1.5. 摘要

mRNA在体内的稳定性有限是疫苗和治疗领域面临的一个主要挑战。虽然环状RNA(circRNA)或自扩增RNA(saRNA)等替代RNA形式提供了更好的持久性,但这些模式通常存在翻译效率低、修饰不兼容以及制造困难等问题。为了克服这些限制,本研究筛选了196,277个病毒序列,并识别出11个能显著增强mRNA稳定性和翻译的元素。从机制上讲,它们通过招募TENT4来延长聚腺苷酸尾(poly(A) tail),从而阻止去腺苷酸化。其中5个元素与N1-甲基假尿苷N1-methylpseudouridine, m1Ψm1Ψ)兼容,后者能提高mRNA的效力并降低免疫原性。一个名为A7的元素在不同细胞类型、递送方法、修饰和编码序列中都表现出特别稳健的性能,使线性mRNA的稳定性与circRNA相当,同时实现了更高的翻译效率。在小鼠肝脏中,含有A7的线性mRNA显示出比circRNA高得多的蛋白质水平,且表达持续超过2周。这些RNA稳定性增强剂RNA stability enhancers)能够构建强大的线性mRNA平台,结合高且持久的表达、低免疫原性和简便的制造工艺。

1.6. 原文链接

/files/papers/69254c689d22cbc32ec0daa2/paper.pdf 该论文已于2025年11月7日在线发表在 Nature Biotechnology 期刊上。

2. 整体概括

2.1. 研究背景与动机

2.1.1. 论文试图解决的核心问题

当前mRNA疫苗和治疗的一个主要挑战是mRNA在体内的有限稳定性,这导致了蛋白质生产的持续时间不足。传统的线性mRNA在进入细胞质后会迅速被降解,主要通过去腺苷酸化deadenylation)途径。

2.1.2. 为什么这个问题在当前领域是重要的?

mRNA技术在疫苗开发(如COVID-19疫苗)和治疗领域(如基因替代疗法、免疫疗法)展现出巨大潜力。然而,mRNA的稳定性直接影响其效力和持续时间。如果mRNA不能稳定存在并持续翻译目标蛋白,其治疗效果将大打折扣,需要更频繁的给药或更高剂量,从而增加成本和潜在副作用。

2.1.3. 现有研究存在哪些具体的挑战或空白?

  1. 替代RNA形式的局限性: 环状RNA (circRNA) 或自扩增RNA (saRNA) 虽然具有更好的持久性,但它们各有缺陷:
    • circRNA:通常翻译效率低,环化程序复杂,且内部核糖体进入位点IRES)与碱基修饰不兼容。
    • saRNA:在细胞内复制会产生双链RNAdsRNA)中间体,触发先天免疫反应,引发安全担忧。
  2. 碱基修饰的兼容性问题: 碱基修饰(如m1Ψm1Ψ)对于降低免疫原性、提高mRNA效力至关重要。然而,许多已知的UTRUntranslated Region,非翻译区)元件在m1Ψm1Ψ修饰的mRNA背景下会丧失活性。
  3. 筛选方法的局限性: 之前的筛选工作受限于病毒多样性不足和基因组覆盖不全,且识别出的稳定元件通常与碱基修饰不兼容,限制了其在治疗中的应用。
  4. 制造复杂性: 一些化学修饰的mRNA(如3'端阻断基团、分支帽、多个poly(A) tail)虽然能增加稳定性,但大规模制造可能面临挑战。

2.1.4. 这篇论文的切入点或创新思路是什么?

本论文的创新点在于:

  1. 大规模系统性筛选: 首次对超过19.6万个病毒序列进行大规模筛选,以寻找能增强m1Ψm1Ψ修饰mRNA稳定性和翻译的元件,极大地扩展了筛选的广度和深度。
  2. 聚焦碱基修饰兼容性:m1Ψm1Ψ兼容性作为筛选的核心标准,直接解决了现有UTR元件与治疗性mRNA修饰不兼容的痛点。
  3. 发现TENT4依赖机制: 揭示了所识别的稳定元件(包括A7)通过招募TENT4酶来延长poly(A) tail,从而增强mRNA稳定性。
  4. 识别独特元件A7: 发现A7这个独特元件,它在不同细胞类型、递送方法、修饰和编码序列中都表现出卓越的稳健性,使线性mRNA能够达到与circRNA相当的稳定性,同时保持更高的翻译效率。
  5. 体内持久性验证: 在小鼠模型中验证了A7能够显著提高线性mRNA的蛋白质表达水平并维持超过2周,证明了其在体内应用的巨大潜力。
  6. 简化制造工艺: 通过增强线性mRNA的稳定性,为开发高表达、持久、低免疫原性且易于制造的mRNA疗法提供了简单而强大的解决方案。

2.2. 核心贡献/主要发现

  1. 识别11个病毒来源的RNA稳定性增强剂: 通过大规模(196,277个)病毒序列筛选,发现了11个能够显著增强碱基修饰(m1Ψm1ΨmRNA稳定性和翻译效率的RNA元件(命名为A1A11)。
  2. 揭示TENT4依赖的混合加尾机制: 所有的增强剂,包括A7,都通过招募TENT4酶来延长poly(A) tail,从而防止去腺苷酸化deadenylation)。Hire-PAT纳米孔直接RNA测序nanopore Direct RNA Sequencing, DRS)证实了这些元件促进了poly(A) tail的延长和混合加尾mixed tailing)。
  3. 区分ZCCHC14依赖性: 大多数含有CNGG基序的元件(如A1A6,A8A11A1-A6, A8-A11)依赖于ZCCHC14辅助因子来招募TENT4。而A7是一个例外,它不含CNGG基序,且不依赖ZCCHC14ZCCHC2,暗示其通过一种尚未识别的TENT4辅助因子起作用。
  4. A7表现出卓越的稳健性和通用性:
    • 广谱细胞类型活性: A7在多种细胞类型中(包括HepG2Jurkat细胞)表现出强大的增强活性。
    • 修饰兼容性: A7不仅与m1Ψm1Ψ兼容,还与m5C5-甲基胞嘧啶)修饰兼容。
    • 分子环境适应性: A7的活性不受5'UTR、编码序列长度、密码子优化、RNA二级结构、尿苷含量或翻译位置(游离或ER相关核糖体)变化的影响。
  5. A7使线性mRNA与circRNA具有可比稳定性但翻译效率更高: 在体外,含有A7的线性mRNA显示出与circRNA相当的半衰期,但蛋白质产量显著高于circRNAHepG2HCT116细胞中AUC值分别高5.3倍和5.8倍)。
  6. 体内持久表达: 在小鼠模型中,含有A7的线性mRNA导致持续超过2周的蛋白质表达,远超对照线性mRNAcircRNA
  7. 为mRNA疗法提供简单强大平台: 这些RNA稳定性增强剂,特别是A7,为开发结合高表达、持久性、低免疫原性和简单制造工艺的线性mRNA疗法提供了一种新策略,克服了现有替代RNA平台的局限性。

3. 预备知识与相关工作

3.1. 基础概念

3.1.1. mRNA (Messenger RNA)

信使RNA (mRNA) 是一种单链核糖核酸分子,负责将DNA中的遗传信息从细胞核传递到细胞质中的核糖体,指导蛋白质合成。在疫苗和治疗中,合成的mRNA(即体外转录IVT mRNA)被导入细胞,指导细胞产生特定的蛋白质(如病毒抗原、治疗性蛋白)。

3.1.2. 5' Cap (5'帽) 和 Poly(A) Tail (聚腺苷酸尾)

  • 5' Cap (5'帽): 位于mRNA分子的5'端,是一种特殊的化学修饰(通常是7-甲基鸟苷),在真核生物mRNA中扮演多重角色。它保护mRNA免受核酸外切酶exoribonucleases)的降解,并参与启动蛋白质合成(帽依赖性翻译cap-dependent translation)和mRNA的核输出。
  • Poly(A) Tail (聚腺苷酸尾): 位于mRNA分子的3'端,由数百个腺苷酸残基组成。Poly(A) tail对于mRNA的稳定性、翻译效率和核输出至关重要。poly(A)-binding proteins (PABPCs) 会结合poly(A) tail并与EIF4G真核翻译起始因子4G)相互作用,促进翻译起始。

3.1.3. mRNA降解途径 (mRNA Degradation Pathway) 和 去腺苷酸化 (Deadenylation)

  • mRNA降解途径: 细胞内存在多种机制来调控mRNA的寿命和丰度。在细胞质中,主要的mRNA降解途径始于poly(A) tail的缩短。
  • Deadenylation (去腺苷酸化): 这是mRNA降解的限速步骤rate-determining step)。CCR4-NOT复合物是主要的去腺苷酸化酶deadenylase),它会逐步移除poly(A) tail上的腺苷酸。一旦poly(A) tail缩短到一定阈值(例如小于27个核苷酸),PABPCs就会从poly(A) tail解离,随后触发mRNA尿苷酸化uridylation)、脱帽decapping)和进一步的RNA降解。

3.1.4. 碱基修饰 (Base Modifications)

IVT mRNA中引入碱基修饰是提高其治疗潜力的关键策略:

  • Pseudouridine (Ψ) 和 N1-methylpseudouridine (m1Ψ): 假尿苷 (ΨΨ) 和 N1-甲基假尿苷 (m1Ψm1Ψ) 是最常用的修饰。它们通过多种机制增强mRNA效力并降低免疫原性:
    • 减少dsRNA副产物: IVT过程中可能产生双链RNA (dsRNA) 副产物,这些dsRNA会激活先天免疫传感器(如蛋白激酶R (PKR) 和寡腺苷酸合成酶 (OAS)),导致全局翻译抑制RNA降解干扰素interferon)和炎症细胞因子inflammatory cytokine)的产生。ΨΨm1Ψm1Ψ修饰可以减少dsRNA的形成。
    • 逃避免疫检测: ΨΨm1Ψm1Ψ修饰的RNA能够逃避RNase T2介导的裂解,并与TLR7TLR8Toll样受体7/8)结合不良,从而降低免疫原性。
    • TRIM25抑制: TRIM25是一种蛋白质,通过N4BP1KHNYNZAP等效应器促进外源RNA降解。碱基修饰有助于阻止TRIM25的激活。
  • 5-methylcytidine (m5C) 和 5-methoxyuridine (mo5U): 其他修饰如m5Cmo5U也被用于降低dsRNA副产物和免疫反应。

3.1.5. TENTs (Terminal Nucleotidyltransferases)

末端核苷酸转移酶 (TENTs) 是一类可以在RNA分子3'端添加核苷酸的酶,可以对抗去腺苷酸化

  • TENT4 (TENT4A 和 TENT4B): TENT4酶主要通过掺入腺苷酸残基,偶尔也掺入非腺苷酸残基来延长poly(A) tail。这种产生的混合尾mixed tail)能够有效抵抗CCR4-NOT复合物的去腺苷酸化,从而增强mRNA稳定性。
  • 辅助因子 (Cofactors): TENT4的活性受多种辅助因子的调节,例如:
    • ZCCHC14: 结合CNGG基序,是TENT4的辅助因子,参与在RNA上生成混合尾
    • ZCCHC2: 另一个TENT4的辅助因子,与不含CNGG基序的Kobuvirus K5元件相互作用。

3.1.6. UTRs (Untranslated Regions)

非翻译区 (UTRs)mRNA分子中不编码蛋白质的部分,位于5' Cap3' poly(A) tail之间。

  • 5'UTR (5'非翻译区): 位于翻译起始密码子(AUG)上游。
  • 3'UTR (3'非翻译区): 位于翻译终止密码子下游,poly(A) tail上游。 UTRs含有多种顺式作用元件(cis-acting elements)和结合位点,可以招募调节蛋白,从而强烈影响mRNA的稳定性、翻译效率、亚细胞定位和降解。优化UTRs是提高治疗性mRNA性能的重要策略。

3.2. 前人工作

3.2.1. 替代RNA平台

  • Circular RNA (circRNA, 环状RNA): circRNA因其环状结构而天然免疫于核酸外切酶exoribonucleases)的降解,具有更长的半衰期。然而,它们通常存在翻译效率较低、需要复杂环化程序以及内部核糖体进入位点 (IRES) 与碱基修饰不兼容等问题。IRES是一种RNA序列,允许在没有5' Cap的情况下直接在内部起始翻译。
  • Self-amplifying RNA (saRNA, 自扩增RNA) 或 Trans-amplifying RNA (taRNA, 反式扩增RNA): 这些平台基于病毒RNA复制子,在细胞内可以自我复制RNA,从而实现蛋白质的持续生产。但是,saRNA在复制过程中会产生双链RNA (dsRNA) 中间体,这会触发宿主细胞的先天免疫反应,导致干扰素interferon)和炎症细胞因子inflammatory cytokine)的产生,从而引发潜在的安全担忧。

3.2.2. 合成mRNA的化学修饰

除了碱基修饰,研究人员还尝试通过其他化学修饰来提高mRNA稳定性:

  • 3'端阻断基团 (3' end blocking groups): 阻止3'核酸外切酶的降解。
  • 分支帽 (branched caps): 增强5' Cap的保护作用。
  • 多个poly(A) tail (multiple poly(A) tails): 延长mRNA的寿命。 尽管这些方法可以增加稳定性,但大规模制造这些复杂修饰的mRNA可能具有挑战性。

3.2.3. UTRs优化

通过优化标准线性mRNAUTRs,使用天然或合成的UTR序列,可以提高mRNA的稳定性和翻译效率。然而,这种方法的改进通常比较有限。

3.2.4. 病毒元件筛选

先前也有研究尝试从病毒中筛选RNA元件来增强基因表达。例如,本文作者之前的研究(Seo et al., 2023)就鉴定了一些病毒元件。但是,这些早期发现的元件大多与m1Ψm1Ψ等碱基修饰不兼容,这限制了它们在治疗应用中的潜力,因为碱基修饰对于降低免疫原性至关重要。

3.3. 技术演进

mRNA技术从最初的理论研究发展到如今的疫苗和治疗应用,经历了多个关键的技术演进。早期,mRNA的体内应用受到其固有不稳定性和强免疫原性的限制。Katalin KarikóDrew Weissman等人发现假尿苷 (ΨΨ) 和N1-甲基假尿苷 (m1Ψm1Ψ) 等碱基修饰能显著降低mRNA的免疫原性并提高翻译效率,是mRNA疗法发展的里程碑。此后,研究重心转向如何进一步延长mRNA在体内的持续时间,以实现更持久的治疗效果。UTR优化、poly(A) tail调控以及新型RNA平台(如circRNAsaRNA)的开发都是这一方向的努力。本文的工作代表了mRNA稳定性研究的最新进展,它通过大规模、系统化的筛选,发现了能够与关键碱基修饰兼容的病毒源RNA稳定性增强剂,并揭示了它们通过TENT4介导的poly(A) tail延长机制,从而使得线性mRNA在稳定性上能与circRNA媲美,同时保持了高翻译效率。

3.4. 差异化分析

本研究与相关工作的主要差异化和创新点在于:

  1. 兼容碱基修饰: 最大的创新是其筛选出的RNA元件(特别是A7)能够与m1Ψm1Ψm5C等碱基修饰兼容。这解决了先前UTR优化和病毒元件筛选中普遍存在的兼容性问题,使得这些增强剂可以直接应用于临床前和临床阶段的治疗性mRNA
  2. 大规模和高通量筛选: 相比于之前有限的病毒多样性和基因组覆盖,本研究筛选了近20万个病毒序列,极大地提高了发现高效稳定元件的可能性。
  3. 机制深入: 不仅识别了功能性元件,还深入探究了其作用机制,明确了TENT4介导的poly(A) tail延长和混合加尾是核心机制,并区分了ZCCHC14依赖性。
  4. A7的卓越性能: A7元件在多种细胞类型、递送方式和分子背景下(不同5'UTRCDS、密码子优化、RNA二级结构、尿苷含量、翻译位置)都表现出高度的稳健性和通用性,这是其他已知元件难以比拟的。
  5. 与替代平台的优势对比: 本研究表明,含有A7的线性mRNA在稳定性上可以与circRNA匹敌,但翻译效率显著更高,且制造工艺更简单。与saRNA相比,它避免了dsRNA诱导的免疫原性问题,更具安全性。

4. 方法论

本研究旨在通过系统性筛选病毒序列,发现能够增强碱基修饰mRNA稳定性与翻译效率的RNA元件。核心方法包括大规模病毒基因组tile库的构建、分两阶段的荧光和mRNA稳定性筛选、深层诱变分析以揭示结构功能关系、以及详细的机制验证(TENT4依赖性、poly(A) tail延长和混合加尾)。

4.1. 方法原理

研究的核心思想是利用病毒基因组作为RNA稳定性增强元件的宝库,因为病毒为了在宿主细胞中高效复制和表达,往往会演化出能劫持宿主RNA调控机制的RNA元件。通过构建包含大量病毒序列片段的tile库,并在碱基修饰mRNA的背景下进行高通量筛选,可以识别出既能增强稳定性又能兼容治疗性mRNA修饰的元件。随后,通过机制研究揭示这些元件如何通过调控poly(A) tail动态来发挥作用。

4.2. 核心方法详解

4.2.1. 病毒基因组Oligo设计与文库构建

  1. 序列来源: 从美国国家生物技术信息中心(NCBI)病毒基因组浏览器获取感染脊椎动物的病毒基因组序列(n=2,678n=2,678,代表1,878种不同病毒)。选择标准包括每个属至少一个代表性病毒,对致病性重要的属(如黄病毒甲病毒β冠状病毒等)进行扩展表示。
  2. 序列处理:
    • RNA病毒: 使用正义链positive-sense)的全基因组平铺whole-genome tiling)。
    • DNA病毒: 使用非编码RNAnoncoding RNAs)和推定的调控区域putative regulatory regions)。调控区域定义为从每个CDS3'端到同一基因片段中3'相邻CDS5'端。如果缺少相邻CDS,则使用最近的PASpolyadenylation signal)确定边界。若PAS未知,则预测或取终止密码子stop codon)下游390bp区域。
  3. Tile设计: 采用197 nt滑动窗口sliding window)和20 nt步长step size)设计寡核苷酸(oligos)。为保持序列完整性,遇到AscINotI限制性位点时,窗口会在此处终止,下一个片段从同一位置开始。
  4. 对照: 包含Saffold virusK4(对m1Ψm1Ψ修饰mRNA有部分增强作用)和AichivirusK5(仅对未修饰mRNA有效)作为阳性对照,以及它们的非功能性突变体(K4mK5m)和Hepatitis D virus核酶序列作为阴性对照。
  5. 文库划分:oligos分为两个子集VL1(单链RNA病毒)和VL2(其他病毒),共计196,277个独特的oligos
  6. PCR扩增与克隆: oligos通过PCR扩增并引入AscINotI限制性位点。扩增产物消化后,克隆到pmirGLO 3x miR-1Pa01-pmirGLO-EGFP-3x miR-1载体的3'UTR区域。

4.2.2. 初级筛选:蛋白质输出增强(基于FACS)

  1. 细胞准备:pPaO1-PhiC31-Pa01-pEF-attB-LSR-BFP-IRES-Hyg质粒与pCMVInt共转染至HEK293T细胞,筛选后获得HEK293TR细胞系,确保每个细胞只插入一个病毒元件。

  2. 文库转染与整合:VL1VL2质粒文库池转染至HEK293TR细胞,使用Pa01整合酶系统将病毒元件整合到EGFP基因的3'UTR报告基因盒reporter cassette)包含EF1αEF1α来源的5'UTRPa01重组位点、带有三个miR-1靶位点的3'UTR间隔区和SV40 polyadenylation signal (PAS)。

  3. FACS富集: 对细胞进行两轮荧光激活细胞分选 (FACS),严格富集具有高GFP荧光(即蛋白质输出高)的细胞(取最高0-0.5%)。

  4. gDNA提取与验证: 从分选后的细胞中提取基因组DNA (gDNA)。K4K5(未修饰mRNA条件下)的富集得到证实,其非活性突变体未被富集。

    该图像是多个实验结果的组合,包括针对mRNA稳定性的筛选结果和参与因子的相关性分析。图a显示了不同时间点下的荧光素酶活性,图b展示了主要筛选过程,图c和图d提供了不同因子的活性对比,图e则表示了Spearman相关系数的矩阵,图f展示了四组重复实验间的对比情况,图g为稳定元素的分布,图h强调了候选体的验证结果。 该图像是多个实验结果的组合,包括针对mRNA稳定性的筛选结果和参与因子的相关性分析。图a显示了不同时间点下的荧光素酶活性,图b展示了主要筛选过程,图c和图d提供了不同因子的活性对比,图e则表示了Spearman相关系数的矩阵,图f展示了四组重复实验间的对比情况,图g为稳定元素的分布,图h强调了候选体的验证结果。 Extended Data Fig. 1b 展示了m1Ψm1Ψ修饰mRNA的初级筛选流程。病毒基因组序列被分割成197 ntoligos,步长为20 nt,共计196,277oligos。这些oligos被克隆到EGFP质粒的3'UTR中,并通过Pa01整合酶整合到基因组中。FACS分选出荧光信号强度最高的0.5%细胞。来自这些分选细胞的EGFP 3'UTR变异区域(约10,784个)通过PCR扩增,随后克隆到荧光素酶luciferase)质粒的3'UTR中用于次级筛选。

4.2.3. 次级筛选:m1Ψ-修饰mRNA稳定性(基于IVT和测序)

  1. 文库合并与克隆:VL1VL2中富集的病毒片段池化,PCR扩增后插入到荧光素酶 (firefly luciferase) 报告质粒的3'UTR中。K3元件(对修饰mRNA有部分增强作用)也被加入文库。
  2. IVT mRNA合成: 使用该质粒文库作为模板,通过体外转录 (IVT) 合成mRNAIVT过程中,用m1Ψ-5'-三磷酸m1Ψ-5'-triphosphate)替代尿苷酸,以生成m1Ψm1Ψ修饰的mRNAmRNA含有β-珠蛋白 (HBB) 5'UTRA60 3'末端序列。
  3. 转染与RNA提取:m1Ψm1Ψ修饰mRNA通过脂质纳米颗粒 (LNP) 转染到HCT116细胞中。3小时后更换培养基。在0小时(更换培养基后)和36小时提取总RNA
  4. RT-PCR与测序:RNA进行逆转录 (RT),PCR扩增3'UTR区域,并引入唯一分子索引 (UMI),然后进行纳米孔测序
  5. 数据分析: 使用DESeq2计算每个元件在36h/0h36h/0hlog2倍数变化(log2 fold change),并进行PP值调整。
    • log2倍数变化 =log2(36小时RNA水平0小时RNA水平) = \log_2(\frac{\text{36小时RNA水平}}{\text{0小时RNA水平}})
    • 富集标准:调整后的PP<0.001< 0.001log2倍数变化 >0.4 > 0.4
    • 结果:1.21%131tile)的病毒序列显著增强了m1Ψm1Ψ修饰mRNA的稳定性,形成11个稳定簇(A1A11)。

4.2.4. 筛选结果验证与优化

  1. 构建长短元件: 对每个稳定簇,构建两个荧光素酶编码结构:一个包含197 nttile(具有最低PP值和稳健预测RNA结构),另一个是核心功能基序minimal functional core)的短片段(A1SA11S)。
  2. 荧光素酶活性检测: 将这些元件集成到mRNA中,测试它们在未修饰和m1Ψm1Ψ修饰mRNA中的荧光素酶表达水平。
    • 结果:A1, A2, A4, A6, A7五个元件在m1Ψm1Ψ修饰mRNA中保留了60%以上的活性,表明其兼容性。大多数短片段(A1S, A4S, A5S, A6S, A7S, A9S, A10S, A11S)表现出与长片段相当或更高的活性。

4.2.5. 深层诱变分析 (Deep Mutagenesis Analysis)

为了理解元件的结构-功能关系,对A1S, A2, A4, A6, A7进行了深层诱变

  1. 突变类型:
    • 单核苷酸替换: 替换每个位置的核苷酸。
    • 单核苷酸或双核苷酸删除: 删除序列中的一个或两个连续核苷酸。
    • 补偿性突变: 替换或删除预测的碱基对base pairs)以维持配对。
    • 插入:CNGGN五联环(pentaloop)中插入核苷酸,以研究环大小的重要性。
    • 双替换: 在环和鼓泡(bulges)中连续两个核苷酸进行双替换,以及CNGGN环的第二个和第五个位置进行双替换,以研究序列特异性。
  2. 筛选流程: 合成4,542个突变oligos,克隆到荧光素酶报告基因的3'UTR。合成m1Ψm1Ψ修饰IVT mRNA池,转染HCT116细胞,在0h36h后通过RNA测序测量突变对稳定性的影响。
  3. 结构预测: 基于诱变数据,更准确地预测RNA二级结构,尤其对于A7,其结构与EternaFold预测的不同,更接近分支结构branched structure)。
    • 结果:A7包含AGACCY基序(内部环internal loop)和GGGGNARUD基序(茎环2stem loop 2),这两个基序对其稳定性功能至关重要。其他元件的CNGGN五联环中,特定的C, G, G1, 3, 4位)核苷酸是关键。

      Fig. 3 | Deep mutagenesis analyses reveal key structural and sequence features. a, Mutagenesis workflow. Single-nucleotide substitutions, singlenucleotide and double-nucleotide deletions, compensatory mutations, insertions and double substitutions are included for mutants. Oligos are cloned to 3' UTR of firefly reporters and IVT screening was performed the same way as the initial screening. b, The impact of mutagenesis is represented by the \(\\log _ { 2 }\) fold change \(( 3 6 \\mathsf { h } / 0 \\mathsf { h } )\) for single-substitution mutants (top) and 1-nt or 2-nt deletions (bottom) of A7S (61197 nt). Horizontal gray dotted lines indicate the \(\\log _ { 2 }\) fold change of A7S. The circle size represents adjusted Pvalues. Pvalues were calculated using a Wald test with multiple-testing adjustments. c, The mean \(\\log _ { 2 }\) fold change (36 h/0 h, \( { \\mathrm { I o g } } _ { 2 } { \\mathrm { F C } } )\) of single substitutions and 1-nt deletion are 该图像是图表,展示了不同突变对A7S和A2S元素的影响及其结构特征。图b展示了A7S的突变影响,横轴为全长元件中的位置,纵轴为log₂(36h/0h)比值,点的大小代表调整后的p值。图c呈现了A7的结构和不同突变的log₂(FC)变化。图d和图e类似,分别显示了A2S的突变影响及其结构特征。整体分析揭示了关键的结构与序列特征。 Figure 3 展示了深层诱变分析揭示关键结构和序列特征的流程。

aa图:诱变流程。包括单核苷酸替换、单/双核苷酸删除、补偿性突变、插入和双替换。oligos克隆到荧光素酶报告基因的3'UTR,然后进行IVT筛选。 bb图:A7S61197nt61-197 nt)单替换突变(上)和1-nt或2-nt删除突变(下)的log2倍数变化(36h/0h36h/0h)影响。水平灰色虚线表示A7Slog2倍数变化。圆圈大小代表调整后的PP值。 cc图:A7 RNA二级结构中单替换和1-nt删除的平均log2倍数变化(36h/0h36h/0h)。蓝色线宽度表示log2倍数变化。 dd图:A2S101177nt101-177 nt)单替换突变(上)和1-nt或2-nt删除突变(下)的log2倍数变化(36h/0h36h/0h)影响。 ee图:A2 RNA二级结构中单替换和1-nt删除的平均log2倍数变化(36h/0h36h/0h)。

4.2.6. 机制验证:TENT4依赖性与混合加尾

  1. TENT4抑制剂实验: 使用TENT4抑制剂RG7834及其非活性R-异构体RO0321)处理细胞。
    • 结果:所有11个元件的增强作用在RG7834处理细胞中均被RG7834抑制,表明它们都依赖于TENT4,即使A7没有CNGG基序。
  2. 辅助因子KO细胞系:ZCCHC14-敲除KO)和ZCCHC2-KO细胞中测试元件活性。
    • 结果:所有含CNGG环的元件(A1A6,A8A11A1-A6, A8-A11)在ZCCHC14-KO细胞中失活,但在ZCCHC2-KO细胞中功能正常,表明它们严格依赖ZCCHC14A7在两种KO细胞系中都保持活性,暗示其可能通过未识别的适配蛋白招募TENT4
  3. Hire-PAT (High-resolution poly(A) tail assay): 测量poly(A) tail长度分布。
    • 原理:mRNA3'poly(A) tail通过酵母poly(A)聚合酶yeast poly(A) polymerase)添加GI tail鸟苷-肌苷guanosine-inosine),然后用基因特异性RT引物gene-specific RT primer)进行逆转录,再通过PCR扩增。通过DNA测序仪进行片段分析fragment analysis),根据片段长度推断poly(A) tail的长度。
    • 实验:将具有60 nt poly(A) tailm1Ψm1Ψ修饰mRNA转染到HCT116细胞。
    • 结果:对照mRNA12h内显著去腺苷酸化。含有病毒元件的mRNApoly(A) tail被延长,甚至超过原始长度,表明元件促进了poly(A) tail的延长。RG7834抑制剂处理后,poly(A) tail长度缩短。
  4. Nanopore Direct RNA Sequencing (DRS) (纳米孔直接RNA测序): 精确测量poly(A) tail长度和核苷酸组成。
    • 原理:DRS直接测序RNA分子,避免了PCR引入的偏差(PCR可能偏向于短的poly(A) tail)。通过分析离子电流信号,可以识别poly(A) tail的长度和其中的非腺苷酸nonadenosine)掺入(即混合尾)。

    • 实验:转染m1Ψm1Ψ修饰mRNA(对照、A2A7)到HCT116细胞,12h后进行DRS

    • 结果:对照RNApoly(A) tail缩短(中位数38 nt),而A2A7 RNApoly(A) tail显著延长(中位数分别为163 nt91 nt)。RG7834处理后,这些延长现象被消除。离子电流信号分析显示,A2A7 mRNApoly(A) tail中掺入了非腺苷酸,证实了混合加尾,且这种现象在RG7834处理后消失。

      该图像是多幅图表,展示了不同 RNA 元素对荧光素酶活性的影响及其 mRNA 稳定性。图 a 和 e 详细说明了在 96 小时内的荧光素酶活性,图 c 和 g 则比较了各种 RNA 处理条件下的信号强度。图 d 展示了不同 RNA 元素的尾部长度分布,图 h 说明了含有 CNGG 动机的元件与 mRNA 稳定性之间的关系。 该图像是多幅图表,展示了不同 RNA 元素对荧光素酶活性的影响及其 mRNA 稳定性。图 a 和 e 详细说明了在 96 小时内的荧光素酶活性,图 c 和 g 则比较了各种 RNA 处理条件下的信号强度。图 d 展示了不同 RNA 元素的尾部长度分布,图 h 说明了含有 CNGG 动机的元件与 mRNA 稳定性之间的关系。 Figure 4 展示了病毒RNA稳定性增强剂通过TENT4依赖的混合加尾作用。

aa图:在HCT116亲本细胞和ZCCHC14-KO细胞中,AA元件m1Ψm1Ψ修饰荧光素酶mRNARO0321RG7834100 nM)存在下的荧光素酶活性。所有11个测试元件的增强效果在RG7834处理的细胞中被抑制。所有含有CNGG环的元件(A1, A2, A3, A4, A5, A6, A8, A9, A10, A11)在ZCCHC14-KO细胞中失活。 cc图:通过Hire-PAT测量m1Ψm1Ψ修饰mRNApoly(A) tail分布。HCT116细胞电穿孔后,与TENT4抑制剂RG7834100 nM)孵育12h。含有病毒元件的mRNApoly(A) tail被延长。 dd图:纳米孔DRS分析poly(A) tail长度。HCT116细胞转染1 µg电穿孔IVT mRNA(对照、A2A7)后12hA2A7报告基因显示出延长的poly(A) tailee图:在HeLa亲本细胞和ZCCHC2-KO细胞中,AA元件m1Ψm1Ψ修饰荧光素酶mRNARO0321RG7834100 nM)存在下的荧光素酶活性。A7在两种KO细胞系中都保持活性。 gg图:在HCT116亲本细胞和ZCCHC14-KO细胞中,通过Hire-PAT测量m1Ψm1Ψ修饰mRNApoly(A) tail分布。对于除A7以外的所有测试元件,亲本细胞中的poly(A) tail延长在ZCCHC14-KO细胞中被消除。 hh图:AA元件通过TENT4延长poly(A) tail的稳定机制图。所有AA元件都通过ZCCHC14-TENT4``混合加尾复合物延长poly(A) tail,而A7则通过TENT4和未识别的辅助因子延长poly(A) tail

4.2.7. 跨细胞类型和分子背景的活性评估

  1. 多细胞类型测试:HepG2(肝细胞)、A549(肺上皮细胞)、MCF7(乳腺癌)、THP1(单核细胞)、Jurkat(T细胞)和HeLa(宫颈癌)细胞中评估元件活性。
    • 结果:A2A7在多种细胞类型中显示出最强和最广泛的活性。A7在除THP1外的所有测试细胞系中都表现出稳健活性。
  2. 兼容性测试:
    • m5C修饰: 测试元件与5-甲基胞嘧啶 (m5C) 修饰的兼容性。
      • 结果:只有A7Sm5C修饰下仍然具有功能。
    • 不同5'UTR: 使用COVID-19疫苗mRNA-12735'UTR5'-1273)和HBA 3'UTR的对照mRNA
      • 结果:A7S显著延长了d2EGFP(短半衰期GFP)信号的持续时间。
    • 不同CDS和密码子优化: 使用流感病毒AA血凝素 (HA) 基因,并应用不同的密码子优化策略(iCodonLinearDesign)来生成具有不同核苷酸组成的CDS
      • 结果:在所有七种测试的CDS中,A7都显著提高了蛋白质输出。

4.2.8. 与circRNA的稳定性比较

  1. RNA半衰期测量:HepG2HCT116细胞中,通过RT-qPCR测量A7S线性mRNAcircRNARNA半衰期。
    • 结果:A7S线性mRNA的半衰期(HepG215.9hHCT11619.0h)与circRNAHepG215.1hHCT11619.5h)相当,远高于对照线性mRNA
  2. 蛋白质水平比较: 测量荧光素酶蛋白质水平随时间的变化。
    • 结果:circRNA早期翻译效率低,总蛋白质输出(AUC)与对照线性mRNA相当。A7S线性mRNA在所有时间点均显示出更高的蛋白质生产,总蛋白质输出(AUC)比circRNA5.3倍(HepG2)和5.8倍(HCT116)。
  3. 免疫原性: 通过RT-qPCR测量ISG15IFIT2水平,确认A7S线性mRNAcircRNA均未触发先天免疫反应。

4.2.9. 体内持续蛋白质表达

  1. 动物模型: 对雄性C57BL/6JC57BL/6J小鼠(8周龄)进行实验。
  2. 递送: 通过尾静脉注射LNP封装的m1Ψm1Ψ修饰荧光素酶mRNA2 µg)。
  3. 生物发光成像: 在第1, 3, 7, 10, 13天进行生物发光成像bioluminescence imaging),追踪荧光素酶表达。在第14天处死小鼠,进行离体器官成像。
    • 结果:含有A7SmRNA在第1天产生比对照线性mRNA7倍、比circRNA108倍的发光强度。到第3天,差异更显著(A7S比对照线性mRNA380倍,比circRNA688倍)。A7S线性mRNA荧光素酶表达持续到第13天,甚至在第14天仍在肝脏中可检测到。

      该图像是多幅示意图,展示了不同RNA序列(Lin-Ctrl、CircRNA和Lin-A7S)在HepG2和HCT116细胞中相对RNA水平及其发光活性的变化,并通过成像显示其在小鼠体内的分布和强度。各组的亮度数据和图像也呈现于图i、图j与图k中。 该图像是多幅示意图,展示了不同RNA序列(Lin-Ctrl、CircRNA和Lin-A7S)在HepG2和HCT116细胞中相对RNA水平及其发光活性的变化,并通过成像显示其在小鼠体内的分布和强度。各组的亮度数据和图像也呈现于图i、图j与图k中。 Figure 6 展示了A7赋予线性mRNA类似circRNA的稳定性。

aa图:线性mRNALin-CtrlLin-A7S)和circRNA格式的荧光素酶报告基因构建体示意图。 bb图:HepG2细胞中荧光素酶RNA水平随时间的变化(电穿孔后12h, 18h, 24h, 30h),通过RT-qPCR测量。A7S线性mRNA的半衰期(15.9h)与circRNA15.1h)相当。 cc图:HCT116细胞中荧光素酶RNA水平随时间的变化(电穿孔后12h, 24h, 36h, 48h),通过RT-qPCR测量。A7S线性mRNA的半衰期(19.0h)与circRNA19.5h)相当。 dd图:HepG2细胞中m1Ψm1Ψ修饰mRNAcircRNA7天内的荧光素酶信号。A7S显著提高了蛋白质产量。 ee图:HCT116细胞中m1Ψm1Ψ修饰mRNAcircRNA7天内的荧光素酶信号。 ff图:HepG2HCT116细胞中AUC值(从0天到7天)。A7S线性mRNA的总蛋白质输出比circRNA5.3倍(HepG2)和5.8倍(HCT116)。 gg图:小鼠实验示意图。小鼠接受mRNA静脉注射,随后进行生物发光成像hh图:小鼠体内的生物发光成像A7S在体内表现出持续的荧光素酶表达。 ii图:小鼠实验中生物发光成像的平均辐射信号。A7S导致荧光素酶表达持续到第13天。 jj图:第14天器官成像。 kk图:第14天处死小鼠后肝脏生物发光成像的平均辐射信号。

5. 实验设置

5.1. 数据集

  1. 病毒基因组序列: 2,678个感染脊椎动物的病毒基因组序列,来源于NCBI病毒基因组浏览器。这些序列用于构建RNA元件筛选文库。
  2. 细胞系:
    • HEK293T/HEK293TR: 人胚肾细胞系,用于初级筛选(FACS富集)。
    • HCT116: 人结肠癌细胞系,用于次级筛选、诱变分析、Hire-PATDRSRNA半衰期测量、免疫原性immunogenicity)评估以及d2EGFPHA蛋白表达分析。
    • HepG2: 人肝癌细胞系,用于跨细胞类型活性评估、RNA半衰期测量和荧光素酶表达动力学。
    • A549: 人肺腺癌细胞系,用于跨细胞类型活性评估。
    • MCF7: 人乳腺癌细胞系,用于跨细胞类型活性评估。
    • THP1: 人单核细胞白血病细胞系,用于跨细胞类型活性评估。
    • Jurkat: 人T淋巴细胞系,用于跨细胞类型活性评估。
    • HeLa: 人宫颈癌细胞系,用于ZCCHC2-KO实验和跨细胞类型活性评估。
    • ZCCHC14-KO细胞和ZCCHC2-KO细胞: 用于研究元件的TENT4辅助因子依赖性。
  3. 动物模型: 雄性C57BL/6JC57BL/6J小鼠(8周龄),来源于Daehan-Biolink。用于体内生物发光成像实验,评估mRNA在体内的表达持久性。

5.2. 评估指标

本研究使用了多种评估指标来衡量RNA元件的性能和作用机制,涵盖了mRNA稳定性、翻译效率、poly(A) tail动态、免疫反应和体内效果。

5.2.1. 荧光素酶活性 (Luciferase Activity)

  1. 概念定义: 荧光素酶 (luciferase) 是一种生物发光酶,能够催化底物发出光。通过测量发光强度,可以间接量化细胞内荧光素酶蛋白的表达水平,从而评估mRNA的翻译效率和蛋白质产出。
  2. 数学公式: 荧光素酶活性通常表示为相对发光单位(Relative Light Units, RLU),没有一个统一的数学公式。它通常是发光强度计读数。 Luciferase Activity=RLU实验样本/RLU对照样本 \text{Luciferase Activity} = \text{RLU}_{\text{实验样本}} / \text{RLU}_{\text{对照样本}}
  3. 符号解释:
    • RLU实验样本 \text{RLU}_{\text{实验样本}} :实验组样本的发光强度。
    • RLU对照样本 \text{RLU}_{\text{对照样本}} :对照组样本的发光强度。
    • 在本文中: 荧光素酶信号通常通过将荧光素酶 mRNA海肾荧光素酶 (Renilla luciferase) mRNA共转染,用海肾荧光素酶的表达作为内部对照进行标准化,以校正转染效率差异。最终结果再与无AA元件的对照mRNA进行标准化。

5.2.2. 流式细胞术 (Flow Cytometry)

  1. 概念定义: 流式细胞术 (Flow Cytometry) 是一种细胞分析技术,通过测量细胞通过激光束时散射光和荧光,来量化细胞群体的特征,如d2EGFPdestabilized EGFP,不稳定的EGFP)表达水平。
  2. 数学公式: 流式细胞术结果通常以平均荧光强度(Mean Fluorescence Intensity, MFI)或特定荧光阳性细胞的百分比来表示,没有统一的数学公式。 GFP 信号=MFId2EGFP 阳性细胞 \text{GFP 信号} = \text{MFI}_{\text{d2EGFP 阳性细胞}}
  3. 符号解释:
    • MFId2EGFP 阳性细胞 \text{MFI}_{\text{d2EGFP 阳性细胞}} d2EGFP阳性细胞群体的平均荧光强度。
    • 在本文中: 用于追踪d2EGFP m1Ψm1Ψ修饰mRNAHCT116细胞中的表达持续时间。

5.2.3. RNA水平测量 (RNA Level Measurement)

  1. 概念定义: 通过RT-qPCR逆转录定量PCR)技术,量化特定mRNA在细胞内的丰度。这用于评估mRNA的稳定性和半衰期,以及免疫反应相关基因(如ISG15IFIT2)的表达。
  2. 数学公式: RT-qPCR结果通常用ΔCtΔCtΔΔCtΔΔCt方法进行相对定量。
    • 相对表达量公式 (2^-(ΔΔCt) 方法): 相对表达量=2ΔΔCt \text{相对表达量} = 2^{-\Delta\Delta C_t} 其中,ΔCt=Ct,目标基因Ct,内参基因 \Delta C_t = C_{t, \text{目标基因}} - C_{t, \text{内参基因}} ,并且 ΔΔCt=ΔCt,实验组ΔCt,对照组 \Delta\Delta C_t = \Delta C_{t, \text{实验组}} - \Delta C_{t, \text{对照组}}
  3. 符号解释:
    • Ct,目标基因 C_{t, \text{目标基因}} :目标基因的Ct值(扩增曲线达到阈值时的循环数)。
    • Ct,内参基因 C_{t, \text{内参基因}} GAPDH等内参基因的Ct值。
    • ΔCt,实验组 \Delta C_{t, \text{实验组}} :实验组的ΔCtΔCt值。
    • ΔCt,对照组 \Delta C_{t, \text{对照组}} :对照组的ΔCtΔCt值。
    • 在本文中: RNA半衰期通过拟合指数衰减模型exponential decay model)并根据细胞倍增时间进行调整来计算。ISG15IFIT2水平用于评估mRNA的免疫原性。

5.2.4. 蛋白质水平测量 (Protein Level Measurement)

  1. 概念定义: Western blot蛋白质印迹)是一种常用的分子生物学技术,用于检测和量化生物样品中特定蛋白质的表达水平。
  2. 数学公式: Western blot信号强度通过图像分析软件量化,通常表示为相对于内参蛋白(如GAPDH)的相对密度单位相对灰度值相对蛋白质水平=目标蛋白信号强度内参蛋白信号强度 \text{相对蛋白质水平} = \frac{\text{目标蛋白信号强度}}{\text{内参蛋白信号强度}}
  3. 符号解释:
    • 目标蛋白信号强度 \text{目标蛋白信号强度} HA蛋白条带的信号强度。
    • 内参蛋白信号强度 \text{内参蛋白信号强度} GAPDH蛋白条带的信号强度。
    • 在本文中: 用于量化HA蛋白的表达水平,评估A7元件在不同CDS和密码子优化背景下的增强效果。

5.2.5. Poly(A) Tail 长度分析 (Poly(A) Tail Length Analysis)

  1. 概念定义: Poly(A) tail长度对mRNA的稳定性和翻译至关重要。Hire-PATNanopore DRS是两种用于精确测量poly(A) tail长度及核苷酸组成的先进技术。
    • Hire-PAT (High-resolution poly(A) tail assay): 通过将poly(A) tail转化为含有GI鸟苷-肌苷)的异源聚合物,然后通过RT-PCR片段分析来测量其长度。
    • Nanopore DRS (Nanopore Direct RNA Sequencing): 直接测序RNA分子,避免PCR偏差,通过分析离子电流信号来直接确定poly(A) tail的长度和其中的非腺苷酸掺入(混合尾)。
  2. 数学公式: 无统一公式,结果通常以poly(A) tail长度分布的直方图或中位数长度来表示。 Poly(A) 尾长度=碱基数 \text{Poly(A) 尾长度} = \text{碱基数}
  3. 符号解释:
    • 碱基数poly(A) tail中的核苷酸数量。
    • 在本文中: DRS中通过dorado软件进行初始估计,并使用定制方法基于离子电流信号精炼poly(A) tail5'3'末端位置,并通过转座速度translocation speed)将信号空间缩放到碱基数。

5.2.6. 生物发光成像 (Bioluminescence Imaging)

  1. 概念定义: 生物发光成像 (Bioluminescence Imaging) 是一种非侵入性的体内成像技术,通过检测报告基因(如荧光素酶)产生的生物发光信号来追踪基因表达或细胞活动。
  2. 数学公式: 发光信号通常以辐射度radiance)表示,单位为p/s/cm2/srp/s/cm²/sr(光子/秒/平方厘米/球面度)。 发光信号=辐射度实验组辐射度对照组 \text{发光信号} = \text{辐射度}_{\text{实验组}} - \text{辐射度}_{\text{对照组}} 折叠倍数变化 (Fold Change) 的计算: Fold Change=辐射度实验组辐射度PBS 对照组辐射度参照组辐射度PBS 对照组 \text{Fold Change} = \frac{\text{辐射度}_{\text{实验组}} - \text{辐射度}_{\text{PBS 对照组}}}{\text{辐射度}_{\text{参照组}} - \text{辐射度}_{\text{PBS 对照组}}}
  3. 符号解释:
    • 辐射度实验组 \text{辐射度}_{\text{实验组}} :实验组的生物发光信号强度。
    • 辐射度对照组 \text{辐射度}_{\text{对照组}} :对照组的生物发光信号强度(例如PBS组)。
    • 辐射度参照组 \text{辐射度}_{\text{参照组}} :用于计算倍数变化的参照组信号强度(例如对照线性mRNA组)。
    • 在本文中: 用于评估mRNA在小鼠体内荧光素酶表达的水平和持续时间。

5.2.7. 统计显著性 (Statistical Significance)

  1. 概念定义: 统计显著性用于判断实验观察到的差异是否可能由偶然因素引起,而不是真实的效应。
  2. 数学公式: 主要通过PP值 (P-value) 来表示。
    • P<0.05 P < 0.05 :通常被认为是具有统计学意义。
    • P<0.01 P < 0.01 :通常被认为是具有高度统计学意义。
  3. 符号解释:
    • P P PP值。
    • 在本文中: 广泛使用双侧学生t检验 (two-sided Student's t-test)、Wald检验 (Wald test)(用于log2倍数变化和调整PP值)和双侧Mann-Whitney U检验 (two-sided Mann-Whitney U-test)(用于体内实验)。

5.2.8. 曲线下面积 (Area Under the Curve, AUC)

  1. 概念定义: AUC是在曲线图(通常是蛋白质表达水平时间)下方的面积,用于量化一段时间内总的蛋白质产出或药物暴露量。
  2. 数学公式: AUC通常通过数值积分方法(如梯形法则trapezoidal rule)来计算。 AUC=i=1N1(yi+yi+1)2(xi+1xi) \text{AUC} = \sum_{i=1}^{N-1} \frac{(y_i + y_{i+1})}{2} (x_{i+1} - x_i)
  3. 符号解释:
    • N N :数据点数量。
    • yi y_i :在时间点 xi x_i 对应的蛋白质表达水平。
    • 在本文中: 用于比较不同mRNA形式(线性mRNAcircRNA)在一定时间范围内的总荧光素酶蛋白质产出。

5.2.9. Spearman相关系数 (Spearman Correlation Coefficient)

  1. 概念定义: Spearman相关系数 (Spearman Correlation Coefficient) 是一种非参数的统计量,用于衡量两个变量之间秩关系monotonic relationship)的强度和方向。
  2. 数学公式: ρ=16di2n(n21) \rho = 1 - \frac{6 \sum d_i^2}{n(n^2 - 1)}
  3. 符号解释:
    • ρ \rho Spearman相关系数
    • di d_i :两个变量中第 i i 个数据点的秩次rank)差。
    • n n :数据点的数量。
    • 在本文中: 用于评估次级筛选结果的重复性reproducibility),在不同重复实验的UMI计数之间计算。

5.3. 对比基线

本研究将自己发现的RNA元件与以下基线模型和对照进行了比较:

  1. Control UTR (对照UTR): 包含质粒来源区域和miR-1结合位点的UTR序列,作为通用对照。
  2. mRNA-1273 UTR: 来源于COVID-19疫苗mRNA-1273Moderna疫苗)的3'UTR,该UTR来源于人α-珠蛋白HBA)基因。
  3. BNT162b2 UTR: 来源于COVID-19疫苗BNT162b2辉瑞/BioNTech疫苗)的3'UTR,是人AES UTRmtRNR基因的融合体。
  4. Previously identified viral elements (K1-K9): 作者团队先前筛选到的病毒元件,用于评估它们在m1Ψm1Ψ修饰mRNA背景下的活性,结果显示大多数丧失活性。K3K4作为部分活性对照。
  5. Circular RNA (circRNA, 环状RNA): 一种已知具有高稳定性的替代RNA形式。本研究使用优化过的circRNA,包含HRV-B3 IRESHBA 3'UTR。用于比较A7线性mRNA的稳定性和翻译效率。
  6. Unmodified mRNAs (未修饰mRNA): 未经过碱基修饰的mRNA,用于比较m1Ψm1Ψ修饰mRNA的优越性。
  7. Inactive mutants (非活性突变体):K4mK5m,用于作为筛选中的阴性对照,确保筛选的特异性。
  8. PBS (Phosphate-buffered saline): 在体内实验中作为注射对照。

6. 实验结果与分析

本节详细阐述了论文的实验结果,并对核心发现进行了深入分析。

6.1. 核心结果分析

6.1.1. 已知UTR元件与m1Ψ修饰的兼容性有限

研究首先证实了m1Ψm1Ψ修饰mRNA相比未修饰mRNA具有优越的性能(图1a),这与之前报道一致,尤其在脂质纳米颗粒 (LNP) 递送时效果更显著,可能是由于避免了TRIM25介导的抑制。然而,当测试商业COVID-19疫苗中使用的3'UTR(如mRNA-1273BNT162b23'UTR)时,它们在m1Ψm1Ψ修饰mRNA中的表现并不理想,甚至不如对照UTR或仅略微提高表达(图1b)。更重要的是,作者团队先前发现的病毒元件(K1-K9)中,大多数在m1Ψm1Ψ修饰mRNA背景下丧失了活性,仅有K3K4保留了部分功能(图1c)。这突出表明,需要识别能够与碱基修饰兼容的新型RNA稳定性增强剂。

6.1.2. 系统性筛选发现m1Ψ兼容的病毒RNA元件

通过对196,277个病毒序列进行两阶段大规模筛选,研究成功识别出11个显著增强m1Ψm1Ψ修饰mRNA稳定性和翻译的元件(A1-A11)。初级筛选(基于FACS富集GFP高表达细胞)初步筛选出约10,784个候选序列。次级筛选(基于m1Ψm1Ψ修饰IVT mRNA转染和RNA测序分析36h/0h36h/0hlog2倍数变化)进一步鉴定了131个显著增强mRNA稳定性的tile(调整PP值 < 0.001log2倍数变化 > 0.4),这些tile聚类形成11个稳定元件(图1e,f)。验证实验显示,在m1Ψm1Ψ修饰mRNA中,A1, A2, A4, A6, A7五个元件保留了超过60%的活性,证明了它们的m1Ψm1Ψ兼容性。其中,许多短片段形式(A1S, A4S, A5S, A6S, A7S, A9S, A10S, A11S)甚至表现出与完整197 nt序列相当或更高的活性,表明它们包含了核心功能基序(图1g,h)。

该图像是插图,展示了不同RNA元素在mRNA稳定性影响下的荧光素酶活性及筛选过程。在g和h图中,m1ψ 相较于对照显示了增强的稳定性,且通过数据分析和筛选确定了候选RNA元素。 该图像是插图,展示了不同RNA元素在mRNA稳定性影响下的荧光素酶活性及筛选过程。在g和h图中,m1ψ 相较于对照显示了增强的稳定性,且通过数据分析和筛选确定了候选RNA元素。 Figure 1 展示了系统性筛选病毒元件以增强m1Ψm1Ψ修饰mRNA的过程。

aa图:未修饰(UU)和修饰(m1Ψm1Ψm5CIVT mRNA5天内的荧光素酶信号。m1Ψm1Ψ显示出优越性能。 bb图:3'UTR报告基因IVT mRNA荧光素酶信号。mRNA-1273BNT162b23'UTR表现不佳。 cc图:转染3天后未修饰或m1Ψm1Ψ修饰荧光素酶mRNA荧光素酶活性。已知KK元件在m1Ψm1Ψ修饰mRNA中大多失活。 dd图:病毒序列被平铺到EGFP基因的3'UTR,并整合到HEK293TR细胞中进行初级筛选(FACS分选高GFP荧光细胞)。富集的oligos``PCR扩增并克隆到luciferase CDS3'UTR中进行次级筛选。 ee图:次级筛选数据,yy轴为36h/0h36h/0h RNA水平的log2比值,xx轴为0h UMI计数log2值。橙色标记的稳定tile来自11种病毒。 ff图:按排名排序的单个元件的log2倍数变化(36h/0h36h/0h)。橙色标记稳定元件,黑色线突出显示选定的验证候选元件。 gg图:在HCT116细胞中验证22个选定tileA1-A11及其短片段),包括未修饰和m1Ψm1Ψ修饰mRNAhh图:在HCT116细胞中验证22个选定tileA1-A11及其短片段),包括未修饰和m1Ψm1Ψ修饰mRNA。短片段形式的活性。

6.1.3. 结构特征与TENT4依赖机制

11个元件来源于不同的病毒家族(图2a),但10个元件(除A7外)都共享一个CNGG基序的环状结构(图2b)。A7是唯一的例外,它不含CNGG基序,而是形成两个由内部环internal loop)分隔的茎环stem loops),暗示其作用机制可能不同。

深层诱变分析揭示了这些元件的关键结构和序列特征(图3)。例如,A7采用分支结构,其中内部环IL)包含AGACCY基序,茎环2SL2)包含GGGGNARUD基序,这两个基序对A7的稳定功能至关重要。其他元件的CNGGN五联环中,C, G, G1, 3, 4位)核苷酸是关键。

该图像是示意图,展示了多种病毒的基因组特征,包括HCMV、HBV、Turkey calicivirus等。这些序列的长度和结构特征对于理解RNA稳定性增强剂的筛选过程至关重要。 该图像是示意图,展示了多种病毒的基因组特征,包括HCMV、HBV、Turkey calicivirus等。这些序列的长度和结构特征对于理解RNA稳定性增强剂的筛选过程至关重要。 Figure 2 展示了RNA稳定性增强元件的基因组位置和预测的RNA结构。

aa图:m1Ψm1Ψ修饰mRNA中增强基因表达的病毒元件的基因组组织和位置。 bb图:预测的RNA结构。除A3外,所有其他元件的RNA结构均使用EternaFold预测。

机制研究证实,所有11个元件的增强作用都被TENT4抑制剂RG7834抑制,表明它们都依赖于TENT4(图4a,b)。Hire-PAT纳米孔DRS进一步显示,这些病毒元件能促使poly(A) tail延长,甚至超过原始长度,并且掺入非腺苷酸形成混合尾,这种效应也完全依赖于TENT4(图4c,d)。 辅助因子分析发现,所有含有CNGG环的元件(A1A6,A8A11A1-A6, A8-A11)都严格依赖ZCCHC14,在ZCCHC14-KO细胞中失活。而A7ZCCHC14-KOZCCHC2-KO细胞中都保持活性,表明它可能通过一种未识别的适配蛋白招募TENT4(图4a,e,g,h)。这使得A7成为RNA稳定性增强剂中一个独特类别。

6.1.4. A7的广谱活性和分子环境适应性

A7及其短片段A7S在多种细胞类型(HepG2, A549, MCF7, Jurkat, HeLa)中表现出最强和最广泛的增强活性,仅在THP1细胞中活性较低,表明其具有跨谱系的通用性(图5a)。A7S还与m5C修饰兼容,这进一步拓宽了其应用范围(图5b)。 与商业疫苗UTR相比,A7S显著提高了蛋白质产量,在转染后第3天和第5天分别带来65倍和114倍的蛋白质增加,AUC值也高出4-6倍(图5c)。 此外,A7的活性不受5'UTR(如mRNA-12735'UTR)、编码序列长度(使用d2EGFP)、密码子优化策略(多种HA基因的密码子优化)、RNA二级结构、尿苷含量或翻译位置(游离或ER相关核糖体)的影响(图5d,e,f,g,h)。这种卓越的稳健性使得A7成为一个高度通用的IVT mRNA性能增强工具。

该图像是多幅图表,展示了不同 RNA 元素对荧光素酶活性的影响及其 mRNA 稳定性。图 a 和 e 详细说明了在 96 小时内的荧光素酶活性,图 c 和 g 则比较了各种 RNA 处理条件下的信号强度。图 d 展示了不同 RNA 元素的尾部长度分布,图 h 说明了含有 CNGG 动机的元件与 mRNA 稳定性之间的关系。 该图像是多幅图表,展示了不同 RNA 元素对荧光素酶活性的影响及其 mRNA 稳定性。图 a 和 e 详细说明了在 96 小时内的荧光素酶活性,图 c 和 g 则比较了各种 RNA 处理条件下的信号强度。图 d 展示了不同 RNA 元素的尾部长度分布,图 h 说明了含有 CNGG 动机的元件与 mRNA 稳定性之间的关系。 Figure 5 展示了A7元件在不同分子背景下的功能。

aa图:在HepG2, A549, MCF7, THP1, Jurkat, HeLa细胞中,代表性AA元件(m1Ψm1Ψ修饰mRNA)的荧光素酶表达。A2A7S在多细胞系中表现出强大的活性。 bb图:转染4天后m5C修饰荧光素酶mRNA荧光素酶活性。仅A7Sm5C修饰下仍功能。 cc图:转染后1, 3, 53'UTR报告基因的荧光素酶信号。A7S显示出比mRNA-1273BNT162b2更强的蛋白质生产。 dd图:含有A7S元件的d2EGFP mRNA报告基因构建体示意图。 ee图:HCT116细胞中m1Ψm1Ψ修饰d2EGFP mRNA(含HBA UTRA7S元件)的d2EGFP表达(第1天至第5天),通过流式细胞术测量。A7S显著延长了GFP信号的持续时间。 ff图:含有A7元件的HA报告基因IVT mRNA构建体示意图。 gg图:使用Western blot分析各种密码子优化CDSHA蛋白表达量。A7在所有CDS中均显著提高HA蛋白表达。 hh图:使用Western blot分析HA蛋白表达量。

6.1.5. A7使线性mRNA与circRNA具有可比稳定性但翻译效率更高

RNA半衰期测量显示,A7S线性mRNA的半衰期(在HepG2细胞中为15.9hHCT116细胞中为19.0h)与circRNA的半衰期(在HepG2细胞中为15.1hHCT116细胞中为19.5h)相当,且远高于对照线性mRNA(图6b,c)。 在蛋白质水平上,尽管circRNA具有更长的半衰期,但其早期翻译效率较低,导致总蛋白质输出(AUC)与快速衰减的对照线性mRNA相当。相比之下,A7S线性mRNA在所有时间点都显示出显著更高的蛋白质生产,其总蛋白质输出AUCcircRNA高出5.3倍(HepG2)和5.8倍(HCT116)(图6d,e,f)。这表明A7不仅赋予线性mRNA``circRNA级别的稳定性,而且显著提高了翻译效率。此外,A7S线性mRNAcircRNA均未触发ISG15IFIT2等免疫反应基因的表达(Extended Data Fig. 7b),证实了它们的低免疫原性。

6.1.6. A7实现体内持续蛋白质表达

在小鼠体内实验中,含有A7SmRNA在第1天就产生了比对照线性mRNA~7倍、比circRNA108倍的生物发光强度。到第3天,这种差异更加显著(380倍于对照线性mRNA688倍于circRNA)。尽管circRNA的信号衰减速度慢于对照线性mRNA,但其强度始终低于A7S线性mRNA。最重要的是,含有A7SRNA在体内维持荧光素酶表达长达13天,甚至在第14天处死小鼠后,肝脏中仍能检测到荧光素酶信号(图6h,i,j,k)。这强有力地证明了A7显著增强了线性mRNA在体内的表达持久性。

6.2. 数据呈现 (表格)

本论文未提供需转录的Markdown或HTML格式表格,所有数据均以图表形式呈现。

6.3. 消融实验/参数分析

  1. 深层诱变分析 (Deep Mutagenesis Analysis):

    • 通过对A1S, A2, A4, A6, A7进行单核苷酸替换、删除、补偿性突变、插入和双替换等4,542种突变,揭示了元件内部的关键结构和序列特征(图3)。
    • 例如,A7内部环IL)中的AGACCY基序和茎环2SL2)中的GGGGNARUD基序被确定为其稳定功能的关键。
    • 其他CNGGN五联环元件中,C, G, G1, 3, 4位)核苷酸是功能核心。
    • 环的大小也影响元件功能,5nt环比4nt6nt环更活跃。
    • 这些分析不仅帮助精确预测了RNA二级结构(例如A7的实际结构与EternaFold预测不同),也提供了优化元件的依据。
  2. TENT4抑制剂和辅助因子敲除实验:

    • TENT4抑制: 使用RG7834TENT4抑制剂)处理细胞,发现所有11个元件的增强作用均被消除(图4a,b),证实了它们对TENT4的依赖性。这是一种功能性的消融实验,去除了TENT4的功能,观察到元件活性的消失。
    • ZCCHC14/ZCCHC2敲除:ZCCHC14-KOZCCHC2-KO细胞系中测试元件活性。
      • 结果显示,所有含有CNGG基序的元件(A1A6,A8A11A1-A6, A8-A11)在ZCCHC14-KO细胞中失活,但在ZCCHC2-KO细胞中功能正常(图4a,e),表明它们严格依赖ZCCHC14。这有效地“消除了”ZCCHC14的作用,揭示了元件的辅助因子特异性。

      • A7在两种KO细胞系中都保持活性(图4a,e),表明它不依赖已知的TENT4辅助因子ZCCHC14ZCCHC2,暗示存在未识别的适配蛋白。这进一步对A7的独特机制进行了“消融”式分析。

        这些实验共同构成了对元件功能组分、关键结构域及其作用机制的深入分析,验证了模型(元件)中各组件(如CNGG基序、ILSL2区域)的有效性和重要性。

7. 总结与思考

7.1. 结论总结

本研究通过对196,277个病毒序列进行大规模、系统性筛选,成功识别出11个能够显著增强m1Ψm1Ψ修饰mRNA稳定性和翻译效率的RNA元件。这些元件通过招募TENT4酶,促进poly(A) tail的延长和混合加尾,从而有效阻止去腺苷酸化。其中,A7元件表现出卓越的性能,其作用机制不依赖于已知的TENT4辅助因子ZCCHC14ZCCHC2A7在多种细胞类型、不同碱基修饰(包括m1Ψm1Ψm5C)、以及多样化的分子背景(5'UTRCDS、密码子优化等)下均保持稳健活性。在体外实验中,含有A7的线性mRNA达到了与circRNA相当的稳定性,同时翻译效率显著更高。更重要的是,在小鼠体内,A7能够使线性mRNA实现持续超过2周的蛋白质表达。这些发现为开发高效、持久、低免疫原性且易于制造的线性mRNA治疗平台提供了简单而强大的解决方案。

7.2. 局限性与未来工作

  1. TENT4偏倚性: 尽管所有11个元件都依赖TENT4,但作者承认其筛选方案可能对TENT4介导的调控机制存在偏倚。这不排除存在其他非TENT4依赖的RNA稳定性增强机制未被发现的可能性。
  2. A7辅助因子的未识别: A7的独特之处在于不依赖ZCCHC14ZCCHC2,这表明其可能招募了尚未识别的TENT4适配蛋白。未来工作需要深入研究并鉴定这个未知的辅助因子,这将有助于全面理解A7的作用机制,并可能发现新的RNA调控通路。
  3. 体内进一步表征: 尽管A7在小鼠模型中表现出卓越的体内持久性,但仍需要进一步的体内表征,包括不同给药途径、剂量响应、长期安全性、药代动力学和药效学研究,以支持其未来的临床转化应用。
  4. 作用机制的精细化: 深层诱变分析虽然揭示了关键结构和序列特征,但对于这些特征如何精确地招募TENT4或其辅助因子,以及如何在分子水平上调控混合加尾,仍需更精细的结构生物学和生化研究。
  5. 跨物种和疾病模型的验证: A7在小鼠肝脏中表现良好,但在其他器官、不同动物模型或人类疾病模型中的表现仍需验证。

7.3. 个人启发与批判

7.3.1. 个人启发

  1. 病毒作为生物学工具的宝库: 这项研究再次强调了病毒作为生物学工具的巨大潜力。病毒为了在宿主细胞中生存和复制,演化出了极其精妙的机制来劫持或操纵宿主细胞通路。系统性地挖掘病毒基因组,可以发现意想不到的调控元件,为生物技术和医学应用提供灵感。
  2. 克服技术瓶颈的策略: mRNA疗法面临的核心瓶颈是稳定性、翻译效率和免疫原性。本研究通过“兼容碱基修饰”这一核心设计理念,直接解决了现有解决方案的痛点,展示了在技术发展中聚焦核心限制因素的重要性。
  3. A7的巨大应用潜力: A7元件的通用性(跨细胞类型、修饰兼容、分子环境适应性)和强大效果(高稳定性、高翻译效率、体内持久性)使其成为mRNA疗法领域的“游戏规则改变者”。它有望显著简化mRNA的开发和制造,降低成本,并拓宽mRNA的应用范围,特别是对于需要长期蛋白质表达的基因替代疗法、免疫疗法和组织重编程。
  4. 机制研究的重要性: 仅仅发现功能性元件是不够的,深入理解其作用机制(TENT4依赖的混合加尾)为进一步优化和设计新的RNA元件奠定了基础。A7的独特机制暗示了RNA调控的复杂性和更多未知领域的存在。
  5. 线性mRNA的复兴: 过去,circRNA因其稳定性被寄予厚望,但翻译效率低是其硬伤。A7的发现有望“复兴”线性mRNA,使其在性能上超越甚至替代部分circRNA应用,同时保持线性mRNA制造的简便性优势。

7.3.2. 批判

  1. 筛选范围的泛化性: 尽管筛选了196,277个病毒序列,这已经非常庞大,但这些病毒主要感染脊椎动物。是否存在其他生物界(如植物病毒、昆虫病毒)中更强大或机制更独特的RNA稳定性元件?这项研究的发现是否能完全代表所有可能存在的天然增强剂?
  2. TENT4机制的独占性: 所有的11个阳性元件都依赖TENT4,这可能反映了TENT4在脊椎动物细胞mRNA后转录调控中的主导作用。然而,这也可能是筛选条件(例如,选择HCT116细胞、m1Ψm1Ψ修饰mRNA)导致的偏向性。未来可以探索在不同细胞类型或生理条件下,是否存在其他不依赖TENT4RNA稳定机制。
  3. A7机制的黑箱: A7不依赖ZCCHC14ZCCHC2,但仍依赖TENT4,这意味着存在一个未知的TENT4适配蛋白。这个“黑箱”是当前研究的一个重要局限。在不完全了解其精确分子机制的情况下,对A7进行进一步的合理设计和优化可能会受限。
  4. 体内免疫原性与安全性: 论文提到了A7线性mRNA未触发ISG15IFIT2表达,但在复杂的体内环境中,尤其是在长期或重复给药的情况下,是否会引发其他形式的免疫反应或潜在的毒性(例如,TENT4作为宿主蛋白,持续的poly(A) tail延长是否会影响内源性mRNA平衡)仍需详尽评估。
  5. A7的紧凑性与最小化: 论文发现短片段A7S与长片段A7活性相当,但A7S仍有155 nt。是否能进一步将A7的核心功能基序最小化,以提高mRNA的转录效率和降低潜在的免疫原性(通常越短的RNA元件越不容易被识别)?更短的元件也有助于在空间有限的治疗性mRNA中进行整合。

相似论文推荐

基于向量语义检索推荐的相关论文。

暂时没有找到相似论文。