RNA stability enhancers for durable base-modified mRNA therapeutics
TL;DR 精炼摘要
本研究筛选了196,277个病毒序列,识别出11种能显著增强mRNA稳定性和翻译的RNA稳定性增强剂。这些元素通过招募TENT4延长poly(A)尾,降低去腺苷酸化,提高mRNA的耐久性。特别是元素A7在不同条件下表现优异,实现了与环状RNA相当的稳定性及更高的翻译效率,为新型mRNA疗法的开发奠定了基础。
摘要
Nature Biotechnology nature biotechnology https://doi.org/10.1038/s41587-025-02891-7 Article RNA stability enhancers for durable base-modified mRNA therapeutics Soo-Jin Jung 1,2,5 , Jenny J. Seo 1,2,4,5 , Sunghan Lee 1,2,5 , Seong-In Hyun 1,2 , Ji-eun Lee 1,2 , Sojeong Lee 1,2 , Yeji Lee 3 , Hyeshik Chang 1,2 , Hyukjin Lee 3 , Jin-Hong Kim 1,2 & V. Narry Kim 1,2 The limited stability of mRNA in vivo remains a major challenge for vaccines and therapeutics. While alternative RNA formats such as circular RNA or self-amplifying RNA offer greater durability, these modalities often suffer from low translation, modification incompatibility and difficult manufacturing. To overcome these limitations, we screen 196,277 viral sequences and identify eleven elements …
论文精读
中文精读
1. 论文基本信息
1.1. 标题
RNA stability enhancers for durable base-modified mRNA therapeutics (用于持久性碱基修饰mRNA疗法的RNA稳定性增强剂)
1.2. 作者
Soo-Jin Jung, Jenny J. Seo, Sunghan Lee, Seong-In Hyun, Ji-eun Lee, Sojeong Lee, Yeji Lee, Hyeshik Chang, Hyukjin Lee, Jin-Hong Kim & V. Narry Kim。 作者们主要隶属于韩国科学技术院(Institute for Basic Science)和首尔国立大学(Seoul National University)。
1.3. 发表期刊/会议
Nature Biotechnology。
Nature Biotechnology 是一本在生物技术领域享有极高声誉和影响力的同行评审科学期刊,专门发表生物技术及其相关领域的原创研究、评论和观点。该期刊的发表通常代表着该领域的重要突破和前沿进展。
1.4. 发表年份
2025年。
1.5. 摘要
mRNA在体内的稳定性有限是疫苗和治疗领域面临的一个主要挑战。虽然环状RNA(circRNA)或自扩增RNA(saRNA)等替代RNA形式提供了更好的持久性,但这些模式通常存在翻译效率低、修饰不兼容以及制造困难等问题。为了克服这些限制,本研究筛选了196,277个病毒序列,并识别出11个能显著增强mRNA稳定性和翻译的元素。从机制上讲,它们通过招募TENT4来延长聚腺苷酸尾(poly(A) tail),从而阻止去腺苷酸化。其中5个元素与N1-甲基假尿苷(N1-methylpseudouridine, )兼容,后者能提高mRNA的效力并降低免疫原性。一个名为A7的元素在不同细胞类型、递送方法、修饰和编码序列中都表现出特别稳健的性能,使线性mRNA的稳定性与circRNA相当,同时实现了更高的翻译效率。在小鼠肝脏中,含有A7的线性mRNA显示出比circRNA高得多的蛋白质水平,且表达持续超过2周。这些RNA稳定性增强剂(RNA stability enhancers)能够构建强大的线性mRNA平台,结合高且持久的表达、低免疫原性和简便的制造工艺。
1.6. 原文链接
/files/papers/69254c689d22cbc32ec0daa2/paper.pdf
该论文已于2025年11月7日在线发表在 Nature Biotechnology 期刊上。
2. 整体概括
2.1. 研究背景与动机
2.1.1. 论文试图解决的核心问题
当前mRNA疫苗和治疗的一个主要挑战是mRNA在体内的有限稳定性,这导致了蛋白质生产的持续时间不足。传统的线性mRNA在进入细胞质后会迅速被降解,主要通过去腺苷酸化(deadenylation)途径。
2.1.2. 为什么这个问题在当前领域是重要的?
mRNA技术在疫苗开发(如COVID-19疫苗)和治疗领域(如基因替代疗法、免疫疗法)展现出巨大潜力。然而,mRNA的稳定性直接影响其效力和持续时间。如果mRNA不能稳定存在并持续翻译目标蛋白,其治疗效果将大打折扣,需要更频繁的给药或更高剂量,从而增加成本和潜在副作用。
2.1.3. 现有研究存在哪些具体的挑战或空白?
- 替代RNA形式的局限性: 环状RNA (
circRNA) 或自扩增RNA (saRNA) 虽然具有更好的持久性,但它们各有缺陷:circRNA:通常翻译效率低,环化程序复杂,且内部核糖体进入位点(IRES)与碱基修饰不兼容。saRNA:在细胞内复制会产生双链RNA(dsRNA)中间体,触发先天免疫反应,引发安全担忧。
- 碱基修饰的兼容性问题: 碱基修饰(如)对于降低免疫原性、提高
mRNA效力至关重要。然而,许多已知的UTR(Untranslated Region,非翻译区)元件在修饰的mRNA背景下会丧失活性。 - 筛选方法的局限性: 之前的筛选工作受限于病毒多样性不足和基因组覆盖不全,且识别出的稳定元件通常与碱基修饰不兼容,限制了其在治疗中的应用。
- 制造复杂性: 一些化学修饰的
mRNA(如3'端阻断基团、分支帽、多个poly(A) tail)虽然能增加稳定性,但大规模制造可能面临挑战。
2.1.4. 这篇论文的切入点或创新思路是什么?
本论文的创新点在于:
- 大规模系统性筛选: 首次对超过19.6万个病毒序列进行大规模筛选,以寻找能增强修饰
mRNA稳定性和翻译的元件,极大地扩展了筛选的广度和深度。 - 聚焦碱基修饰兼容性: 将兼容性作为筛选的核心标准,直接解决了现有
UTR元件与治疗性mRNA修饰不兼容的痛点。 - 发现TENT4依赖机制: 揭示了所识别的稳定元件(包括
A7)通过招募TENT4酶来延长poly(A) tail,从而增强mRNA稳定性。 - 识别独特元件A7: 发现
A7这个独特元件,它在不同细胞类型、递送方法、修饰和编码序列中都表现出卓越的稳健性,使线性mRNA能够达到与circRNA相当的稳定性,同时保持更高的翻译效率。 - 体内持久性验证: 在小鼠模型中验证了
A7能够显著提高线性mRNA的蛋白质表达水平并维持超过2周,证明了其在体内应用的巨大潜力。 - 简化制造工艺: 通过增强线性
mRNA的稳定性,为开发高表达、持久、低免疫原性且易于制造的mRNA疗法提供了简单而强大的解决方案。
2.2. 核心贡献/主要发现
- 识别11个病毒来源的RNA稳定性增强剂: 通过大规模(196,277个)病毒序列筛选,发现了11个能够显著增强碱基修饰()
mRNA稳定性和翻译效率的RNA元件(命名为A1到A11)。 - 揭示TENT4依赖的混合加尾机制: 所有的增强剂,包括
A7,都通过招募TENT4酶来延长poly(A) tail,从而防止去腺苷酸化(deadenylation)。Hire-PAT和纳米孔直接RNA测序(nanopore Direct RNA Sequencing,DRS)证实了这些元件促进了poly(A) tail的延长和混合加尾(mixed tailing)。 - 区分ZCCHC14依赖性: 大多数含有
CNGG基序的元件(如)依赖于ZCCHC14辅助因子来招募TENT4。而A7是一个例外,它不含CNGG基序,且不依赖ZCCHC14或ZCCHC2,暗示其通过一种尚未识别的TENT4辅助因子起作用。 - A7表现出卓越的稳健性和通用性:
- 广谱细胞类型活性:
A7在多种细胞类型中(包括HepG2和Jurkat细胞)表现出强大的增强活性。 - 修饰兼容性:
A7不仅与兼容,还与m5C(5-甲基胞嘧啶)修饰兼容。 - 分子环境适应性:
A7的活性不受5'UTR、编码序列长度、密码子优化、RNA二级结构、尿苷含量或翻译位置(游离或ER相关核糖体)变化的影响。
- 广谱细胞类型活性:
- A7使线性mRNA与circRNA具有可比稳定性但翻译效率更高: 在体外,含有
A7的线性mRNA显示出与circRNA相当的半衰期,但蛋白质产量显著高于circRNA(HepG2和HCT116细胞中AUC值分别高5.3倍和5.8倍)。 - 体内持久表达: 在小鼠模型中,含有
A7的线性mRNA导致持续超过2周的蛋白质表达,远超对照线性mRNA和circRNA。 - 为mRNA疗法提供简单强大平台: 这些
RNA稳定性增强剂,特别是A7,为开发结合高表达、持久性、低免疫原性和简单制造工艺的线性mRNA疗法提供了一种新策略,克服了现有替代RNA平台的局限性。
3. 预备知识与相关工作
3.1. 基础概念
3.1.1. mRNA (Messenger RNA)
信使RNA (mRNA) 是一种单链核糖核酸分子,负责将DNA中的遗传信息从细胞核传递到细胞质中的核糖体,指导蛋白质合成。在疫苗和治疗中,合成的mRNA(即体外转录,IVT mRNA)被导入细胞,指导细胞产生特定的蛋白质(如病毒抗原、治疗性蛋白)。
3.1.2. 5' Cap (5'帽) 和 Poly(A) Tail (聚腺苷酸尾)
- 5' Cap (5'帽): 位于
mRNA分子的5'端,是一种特殊的化学修饰(通常是7-甲基鸟苷),在真核生物mRNA中扮演多重角色。它保护mRNA免受核酸外切酶(exoribonucleases)的降解,并参与启动蛋白质合成(帽依赖性翻译,cap-dependent translation)和mRNA的核输出。 - Poly(A) Tail (聚腺苷酸尾): 位于
mRNA分子的3'端,由数百个腺苷酸残基组成。Poly(A) tail对于mRNA的稳定性、翻译效率和核输出至关重要。poly(A)-binding proteins(PABPCs) 会结合poly(A) tail并与EIF4G(真核翻译起始因子4G)相互作用,促进翻译起始。
3.1.3. mRNA降解途径 (mRNA Degradation Pathway) 和 去腺苷酸化 (Deadenylation)
- mRNA降解途径: 细胞内存在多种机制来调控
mRNA的寿命和丰度。在细胞质中,主要的mRNA降解途径始于poly(A) tail的缩短。 - Deadenylation (去腺苷酸化): 这是
mRNA降解的限速步骤(rate-determining step)。CCR4-NOT复合物是主要的去腺苷酸化酶(deadenylase),它会逐步移除poly(A) tail上的腺苷酸。一旦poly(A) tail缩短到一定阈值(例如小于27个核苷酸),PABPCs就会从poly(A) tail解离,随后触发mRNA的尿苷酸化(uridylation)、脱帽(decapping)和进一步的RNA降解。
3.1.4. 碱基修饰 (Base Modifications)
在IVT mRNA中引入碱基修饰是提高其治疗潜力的关键策略:
- Pseudouridine (Ψ) 和 N1-methylpseudouridine (m1Ψ):
假尿苷() 和N1-甲基假尿苷() 是最常用的修饰。它们通过多种机制增强mRNA效力并降低免疫原性:- 减少dsRNA副产物:
IVT过程中可能产生双链RNA(dsRNA) 副产物,这些dsRNA会激活先天免疫传感器(如蛋白激酶R(PKR) 和寡腺苷酸合成酶(OAS)),导致全局翻译抑制、RNA降解、干扰素(interferon)和炎症细胞因子(inflammatory cytokine)的产生。和修饰可以减少dsRNA的形成。 - 逃避免疫检测: 和修饰的
RNA能够逃避RNase T2介导的裂解,并与TLR7和TLR8(Toll样受体7/8)结合不良,从而降低免疫原性。 - TRIM25抑制:
TRIM25是一种蛋白质,通过N4BP1、KHNYN和ZAP等效应器促进外源RNA降解。碱基修饰有助于阻止TRIM25的激活。
- 减少dsRNA副产物:
- 5-methylcytidine (m5C) 和 5-methoxyuridine (mo5U): 其他修饰如
m5C和mo5U也被用于降低dsRNA副产物和免疫反应。
3.1.5. TENTs (Terminal Nucleotidyltransferases)
末端核苷酸转移酶 (TENTs) 是一类可以在RNA分子3'端添加核苷酸的酶,可以对抗去腺苷酸化。
- TENT4 (TENT4A 和 TENT4B):
TENT4酶主要通过掺入腺苷酸残基,偶尔也掺入非腺苷酸残基来延长poly(A) tail。这种产生的混合尾(mixed tail)能够有效抵抗CCR4-NOT复合物的去腺苷酸化,从而增强mRNA稳定性。 - 辅助因子 (Cofactors):
TENT4的活性受多种辅助因子的调节,例如:- ZCCHC14: 结合
CNGG基序,是TENT4的辅助因子,参与在RNA上生成混合尾。 - ZCCHC2: 另一个
TENT4的辅助因子,与不含CNGG基序的KobuvirusK5元件相互作用。
- ZCCHC14: 结合
3.1.6. UTRs (Untranslated Regions)
非翻译区 (UTRs) 是mRNA分子中不编码蛋白质的部分,位于5' Cap和3' poly(A) tail之间。
- 5'UTR (5'非翻译区): 位于翻译起始密码子(
AUG)上游。 - 3'UTR (3'非翻译区): 位于翻译终止密码子下游,
poly(A) tail上游。UTRs含有多种顺式作用元件(cis-acting elements)和结合位点,可以招募调节蛋白,从而强烈影响mRNA的稳定性、翻译效率、亚细胞定位和降解。优化UTRs是提高治疗性mRNA性能的重要策略。
3.2. 前人工作
3.2.1. 替代RNA平台
- Circular RNA (circRNA, 环状RNA):
circRNA因其环状结构而天然免疫于核酸外切酶(exoribonucleases)的降解,具有更长的半衰期。然而,它们通常存在翻译效率较低、需要复杂环化程序以及内部核糖体进入位点(IRES) 与碱基修饰不兼容等问题。IRES是一种RNA序列,允许在没有5' Cap的情况下直接在内部起始翻译。 - Self-amplifying RNA (saRNA, 自扩增RNA) 或 Trans-amplifying RNA (taRNA, 反式扩增RNA): 这些平台基于病毒
RNA复制子,在细胞内可以自我复制RNA,从而实现蛋白质的持续生产。但是,saRNA在复制过程中会产生双链RNA(dsRNA) 中间体,这会触发宿主细胞的先天免疫反应,导致干扰素(interferon)和炎症细胞因子(inflammatory cytokine)的产生,从而引发潜在的安全担忧。
3.2.2. 合成mRNA的化学修饰
除了碱基修饰,研究人员还尝试通过其他化学修饰来提高mRNA稳定性:
- 3'端阻断基团 (3' end blocking groups): 阻止
3'端核酸外切酶的降解。 - 分支帽 (branched caps): 增强
5' Cap的保护作用。 - 多个poly(A) tail (multiple poly(A) tails): 延长
mRNA的寿命。 尽管这些方法可以增加稳定性,但大规模制造这些复杂修饰的mRNA可能具有挑战性。
3.2.3. UTRs优化
通过优化标准线性mRNA的UTRs,使用天然或合成的UTR序列,可以提高mRNA的稳定性和翻译效率。然而,这种方法的改进通常比较有限。
3.2.4. 病毒元件筛选
先前也有研究尝试从病毒中筛选RNA元件来增强基因表达。例如,本文作者之前的研究(Seo et al., 2023)就鉴定了一些病毒元件。但是,这些早期发现的元件大多与等碱基修饰不兼容,这限制了它们在治疗应用中的潜力,因为碱基修饰对于降低免疫原性至关重要。
3.3. 技术演进
mRNA技术从最初的理论研究发展到如今的疫苗和治疗应用,经历了多个关键的技术演进。早期,mRNA的体内应用受到其固有不稳定性和强免疫原性的限制。Katalin Karikó和Drew Weissman等人发现假尿苷 () 和N1-甲基假尿苷 () 等碱基修饰能显著降低mRNA的免疫原性并提高翻译效率,是mRNA疗法发展的里程碑。此后,研究重心转向如何进一步延长mRNA在体内的持续时间,以实现更持久的治疗效果。UTR优化、poly(A) tail调控以及新型RNA平台(如circRNA、saRNA)的开发都是这一方向的努力。本文的工作代表了mRNA稳定性研究的最新进展,它通过大规模、系统化的筛选,发现了能够与关键碱基修饰兼容的病毒源RNA稳定性增强剂,并揭示了它们通过TENT4介导的poly(A) tail延长机制,从而使得线性mRNA在稳定性上能与circRNA媲美,同时保持了高翻译效率。
3.4. 差异化分析
本研究与相关工作的主要差异化和创新点在于:
- 兼容碱基修饰: 最大的创新是其筛选出的
RNA元件(特别是A7)能够与和m5C等碱基修饰兼容。这解决了先前UTR优化和病毒元件筛选中普遍存在的兼容性问题,使得这些增强剂可以直接应用于临床前和临床阶段的治疗性mRNA。 - 大规模和高通量筛选: 相比于之前有限的病毒多样性和基因组覆盖,本研究筛选了近20万个病毒序列,极大地提高了发现高效稳定元件的可能性。
- 机制深入: 不仅识别了功能性元件,还深入探究了其作用机制,明确了
TENT4介导的poly(A) tail延长和混合加尾是核心机制,并区分了ZCCHC14依赖性。 - A7的卓越性能:
A7元件在多种细胞类型、递送方式和分子背景下(不同5'UTR、CDS、密码子优化、RNA二级结构、尿苷含量、翻译位置)都表现出高度的稳健性和通用性,这是其他已知元件难以比拟的。 - 与替代平台的优势对比: 本研究表明,含有
A7的线性mRNA在稳定性上可以与circRNA匹敌,但翻译效率显著更高,且制造工艺更简单。与saRNA相比,它避免了dsRNA诱导的免疫原性问题,更具安全性。
4. 方法论
本研究旨在通过系统性筛选病毒序列,发现能够增强碱基修饰mRNA稳定性与翻译效率的RNA元件。核心方法包括大规模病毒基因组tile库的构建、分两阶段的荧光和mRNA稳定性筛选、深层诱变分析以揭示结构功能关系、以及详细的机制验证(TENT4依赖性、poly(A) tail延长和混合加尾)。
4.1. 方法原理
研究的核心思想是利用病毒基因组作为RNA稳定性增强元件的宝库,因为病毒为了在宿主细胞中高效复制和表达,往往会演化出能劫持宿主RNA调控机制的RNA元件。通过构建包含大量病毒序列片段的tile库,并在碱基修饰mRNA的背景下进行高通量筛选,可以识别出既能增强稳定性又能兼容治疗性mRNA修饰的元件。随后,通过机制研究揭示这些元件如何通过调控poly(A) tail动态来发挥作用。
4.2. 核心方法详解
4.2.1. 病毒基因组Oligo设计与文库构建
- 序列来源: 从美国国家生物技术信息中心(
NCBI)病毒基因组浏览器获取感染脊椎动物的病毒基因组序列(,代表1,878种不同病毒)。选择标准包括每个属至少一个代表性病毒,对致病性重要的属(如黄病毒、甲病毒、β冠状病毒等)进行扩展表示。 - 序列处理:
- RNA病毒: 使用
正义链(positive-sense)的全基因组平铺(whole-genome tiling)。 - DNA病毒: 使用
非编码RNA(noncoding RNAs)和推定的调控区域(putative regulatory regions)。调控区域定义为从每个CDS的3'端到同一基因片段中3'相邻CDS的5'端。如果缺少相邻CDS,则使用最近的PAS(polyadenylation signal)确定边界。若PAS未知,则预测或取终止密码子(stop codon)下游390bp区域。
- RNA病毒: 使用
- Tile设计: 采用
197 nt的滑动窗口(sliding window)和20 nt的步长(step size)设计寡核苷酸(oligos)。为保持序列完整性,遇到AscI或NotI限制性位点时,窗口会在此处终止,下一个片段从同一位置开始。 - 对照: 包含
Saffold virus的K4(对修饰mRNA有部分增强作用)和Aichivirus的K5(仅对未修饰mRNA有效)作为阳性对照,以及它们的非功能性突变体(K4m、K5m)和Hepatitis D virus核酶序列作为阴性对照。 - 文库划分: 将
oligos分为两个子集VL1(单链RNA病毒)和VL2(其他病毒),共计196,277个独特的oligos。 - PCR扩增与克隆:
oligos通过PCR扩增并引入AscI和NotI限制性位点。扩增产物消化后,克隆到pmirGLO 3x miR-1或Pa01-pmirGLO-EGFP-3x miR-1载体的3'UTR区域。
4.2.2. 初级筛选:蛋白质输出增强(基于FACS)
-
细胞准备: 将
pPaO1-PhiC31-Pa01-pEF-attB-LSR-BFP-IRES-Hyg质粒与pCMVInt共转染至HEK293T细胞,筛选后获得HEK293TR细胞系,确保每个细胞只插入一个病毒元件。 -
文库转染与整合: 将
VL1和VL2质粒文库池转染至HEK293TR细胞,使用Pa01整合酶系统将病毒元件整合到EGFP基因的3'UTR。报告基因盒(reporter cassette)包含来源的5'UTR、Pa01重组位点、带有三个miR-1靶位点的3'UTR间隔区和SV40polyadenylation signal(PAS)。 -
FACS富集: 对细胞进行两轮
荧光激活细胞分选(FACS),严格富集具有高GFP荧光(即蛋白质输出高)的细胞(取最高0-0.5%)。 -
gDNA提取与验证: 从分选后的细胞中提取
基因组DNA(gDNA)。K4和K5(未修饰mRNA条件下)的富集得到证实,其非活性突变体未被富集。
该图像是多个实验结果的组合,包括针对mRNA稳定性的筛选结果和参与因子的相关性分析。图a显示了不同时间点下的荧光素酶活性,图b展示了主要筛选过程,图c和图d提供了不同因子的活性对比,图e则表示了Spearman相关系数的矩阵,图f展示了四组重复实验间的对比情况,图g为稳定元素的分布,图h强调了候选体的验证结果。
Extended Data Fig. 1b 展示了修饰mRNA的初级筛选流程。病毒基因组序列被分割成197 nt的oligos,步长为20 nt,共计196,277个oligos。这些oligos被克隆到EGFP质粒的3'UTR中,并通过Pa01整合酶整合到基因组中。FACS分选出荧光信号强度最高的0.5%细胞。来自这些分选细胞的EGFP3'UTR变异区域(约10,784个)通过PCR扩增,随后克隆到荧光素酶(luciferase)质粒的3'UTR中用于次级筛选。
4.2.3. 次级筛选:m1Ψ-修饰mRNA稳定性(基于IVT和测序)
- 文库合并与克隆: 将
VL1和VL2中富集的病毒片段池化,PCR扩增后插入到荧光素酶(firefly luciferase) 报告质粒的3'UTR中。K3元件(对修饰mRNA有部分增强作用)也被加入文库。 - IVT mRNA合成: 使用该质粒文库作为模板,通过
体外转录(IVT) 合成mRNA。IVT过程中,用m1Ψ-5'-三磷酸(m1Ψ-5'-triphosphate)替代尿苷酸,以生成修饰的mRNA。mRNA含有β-珠蛋白(HBB)5'UTR和A603'末端序列。 - 转染与RNA提取: 将修饰
mRNA通过脂质纳米颗粒(LNP) 转染到HCT116细胞中。3小时后更换培养基。在0小时(更换培养基后)和36小时提取总RNA。 - RT-PCR与测序: 对
RNA进行逆转录(RT),PCR扩增3'UTR区域,并引入唯一分子索引(UMI),然后进行纳米孔测序。 - 数据分析: 使用
DESeq2计算每个元件在的log2倍数变化(log2 fold change),并进行值调整。log2倍数变化- 富集标准:调整后的值 且
log2倍数变化 。 - 结果:
1.21%(131个tile)的病毒序列显著增强了修饰mRNA的稳定性,形成11个稳定簇(A1到A11)。
4.2.4. 筛选结果验证与优化
- 构建长短元件: 对每个稳定簇,构建两个
荧光素酶编码结构:一个包含197 nt的tile(具有最低值和稳健预测RNA结构),另一个是核心功能基序(minimal functional core)的短片段(A1S到A11S)。 - 荧光素酶活性检测: 将这些元件集成到
mRNA中,测试它们在未修饰和修饰mRNA中的荧光素酶表达水平。- 结果:
A1, A2, A4, A6, A7五个元件在修饰mRNA中保留了60%以上的活性,表明其兼容性。大多数短片段(A1S, A4S, A5S, A6S, A7S, A9S, A10S, A11S)表现出与长片段相当或更高的活性。
- 结果:
4.2.5. 深层诱变分析 (Deep Mutagenesis Analysis)
为了理解元件的结构-功能关系,对A1S, A2, A4, A6, A7进行了深层诱变:
- 突变类型:
- 单核苷酸替换: 替换每个位置的核苷酸。
- 单核苷酸或双核苷酸删除: 删除序列中的一个或两个连续核苷酸。
- 补偿性突变: 替换或删除预测的
碱基对(base pairs)以维持配对。 - 插入: 在
CNGGN五联环(pentaloop)中插入核苷酸,以研究环大小的重要性。 - 双替换: 在环和鼓泡(
bulges)中连续两个核苷酸进行双替换,以及CNGGN环的第二个和第五个位置进行双替换,以研究序列特异性。
- 筛选流程: 合成
4,542个突变oligos,克隆到荧光素酶报告基因的3'UTR。合成修饰IVT mRNA池,转染HCT116细胞,在0h和36h后通过RNA测序测量突变对稳定性的影响。 - 结构预测: 基于诱变数据,更准确地预测
RNA二级结构,尤其对于A7,其结构与EternaFold预测的不同,更接近分支结构(branched structure)。-
结果:
A7包含AGACCY基序(内部环,internal loop)和GGGGNARUD基序(茎环2,stem loop 2),这两个基序对其稳定性功能至关重要。其他元件的CNGGN五联环中,特定的C, G, G(1, 3, 4位)核苷酸是关键。
该图像是图表,展示了不同突变对A7S和A2S元素的影响及其结构特征。图b展示了A7S的突变影响,横轴为全长元件中的位置,纵轴为log₂(36h/0h)比值,点的大小代表调整后的p值。图c呈现了A7的结构和不同突变的log₂(FC)变化。图d和图e类似,分别显示了A2S的突变影响及其结构特征。整体分析揭示了关键的结构与序列特征。
Figure 3 展示了深层诱变分析揭示关键结构和序列特征的流程。
-
图:诱变流程。包括单核苷酸替换、单/双核苷酸删除、补偿性突变、插入和双替换。oligos克隆到荧光素酶报告基因的3'UTR,然后进行IVT筛选。
图:A7S()单替换突变(上)和1-nt或2-nt删除突变(下)的log2倍数变化()影响。水平灰色虚线表示A7S的log2倍数变化。圆圈大小代表调整后的值。
图:A7 RNA二级结构中单替换和1-nt删除的平均log2倍数变化()。蓝色线宽度表示log2倍数变化。
图:A2S()单替换突变(上)和1-nt或2-nt删除突变(下)的log2倍数变化()影响。
图:A2 RNA二级结构中单替换和1-nt删除的平均log2倍数变化()。
4.2.6. 机制验证:TENT4依赖性与混合加尾
- TENT4抑制剂实验: 使用
TENT4抑制剂RG7834及其非活性R-异构体(RO0321)处理细胞。- 结果:所有
11个元件的增强作用在RG7834处理细胞中均被RG7834抑制,表明它们都依赖于TENT4,即使A7没有CNGG基序。
- 结果:所有
- 辅助因子KO细胞系: 在
ZCCHC14-敲除(KO)和ZCCHC2-KO细胞中测试元件活性。- 结果:所有含
CNGG环的元件()在ZCCHC14-KO细胞中失活,但在ZCCHC2-KO细胞中功能正常,表明它们严格依赖ZCCHC14。A7在两种KO细胞系中都保持活性,暗示其可能通过未识别的适配蛋白招募TENT4。
- 结果:所有含
- Hire-PAT (High-resolution poly(A) tail assay): 测量
poly(A) tail长度分布。- 原理:
mRNA的3'端poly(A) tail通过酵母poly(A)聚合酶(yeast poly(A) polymerase)添加GI tail(鸟苷-肌苷,guanosine-inosine),然后用基因特异性RT引物(gene-specific RT primer)进行逆转录,再通过PCR扩增。通过DNA测序仪进行片段分析(fragment analysis),根据片段长度推断poly(A) tail的长度。 - 实验:将具有
60 nt poly(A) tail的修饰mRNA转染到HCT116细胞。 - 结果:对照
mRNA在12h内显著去腺苷酸化。含有病毒元件的mRNA的poly(A) tail被延长,甚至超过原始长度,表明元件促进了poly(A) tail的延长。RG7834抑制剂处理后,poly(A) tail长度缩短。
- 原理:
- Nanopore Direct RNA Sequencing (DRS) (纳米孔直接RNA测序): 精确测量
poly(A) tail长度和核苷酸组成。-
原理:
DRS直接测序RNA分子,避免了PCR引入的偏差(PCR可能偏向于短的poly(A) tail)。通过分析离子电流信号,可以识别poly(A) tail的长度和其中的非腺苷酸(nonadenosine)掺入(即混合尾)。 -
实验:转染修饰
mRNA(对照、A2、A7)到HCT116细胞,12h后进行DRS。 -
结果:对照
RNA的poly(A) tail缩短(中位数38 nt),而A2和A7RNA的poly(A) tail显著延长(中位数分别为163 nt和91 nt)。RG7834处理后,这些延长现象被消除。离子电流信号分析显示,A2和A7mRNA的poly(A) tail中掺入了非腺苷酸,证实了混合加尾,且这种现象在RG7834处理后消失。
该图像是多幅图表,展示了不同 RNA 元素对荧光素酶活性的影响及其 mRNA 稳定性。图 a 和 e 详细说明了在 96 小时内的荧光素酶活性,图 c 和 g 则比较了各种 RNA 处理条件下的信号强度。图 d 展示了不同 RNA 元素的尾部长度分布,图 h 说明了含有 CNGG 动机的元件与 mRNA 稳定性之间的关系。
Figure 4 展示了病毒RNA稳定性增强剂通过TENT4依赖的混合加尾作用。
-
图:在HCT116亲本细胞和ZCCHC14-KO细胞中,元件修饰荧光素酶mRNA在RO0321或RG7834(100 nM)存在下的荧光素酶活性。所有11个测试元件的增强效果在RG7834处理的细胞中被抑制。所有含有CNGG环的元件(A1, A2, A3, A4, A5, A6, A8, A9, A10, A11)在ZCCHC14-KO细胞中失活。
图:通过Hire-PAT测量修饰mRNA的poly(A) tail分布。HCT116细胞电穿孔后,与TENT4抑制剂RG7834(100 nM)孵育12h。含有病毒元件的mRNA的poly(A) tail被延长。
图:纳米孔DRS分析poly(A) tail长度。HCT116细胞转染1 µg电穿孔IVT mRNA(对照、A2和A7)后12h。A2和A7报告基因显示出延长的poly(A) tail。
图:在HeLa亲本细胞和ZCCHC2-KO细胞中,元件修饰荧光素酶mRNA在RO0321或RG7834(100 nM)存在下的荧光素酶活性。A7在两种KO细胞系中都保持活性。
图:在HCT116亲本细胞和ZCCHC14-KO细胞中,通过Hire-PAT测量修饰mRNA的poly(A) tail分布。对于除A7以外的所有测试元件,亲本细胞中的poly(A) tail延长在ZCCHC14-KO细胞中被消除。
图:元件通过TENT4延长poly(A) tail的稳定机制图。所有元件都通过ZCCHC14-TENT4``混合加尾复合物延长poly(A) tail,而A7则通过TENT4和未识别的辅助因子延长poly(A) tail。
4.2.7. 跨细胞类型和分子背景的活性评估
- 多细胞类型测试: 在
HepG2(肝细胞)、A549(肺上皮细胞)、MCF7(乳腺癌)、THP1(单核细胞)、Jurkat(T细胞)和HeLa(宫颈癌)细胞中评估元件活性。- 结果:
A2和A7在多种细胞类型中显示出最强和最广泛的活性。A7在除THP1外的所有测试细胞系中都表现出稳健活性。
- 结果:
- 兼容性测试:
- m5C修饰: 测试元件与
5-甲基胞嘧啶(m5C) 修饰的兼容性。- 结果:只有
A7S在m5C修饰下仍然具有功能。
- 结果:只有
- 不同5'UTR: 使用
COVID-19疫苗mRNA-1273的5'UTR(5'-1273)和HBA3'UTR的对照mRNA。- 结果:
A7S显著延长了d2EGFP(短半衰期GFP)信号的持续时间。
- 结果:
- 不同CDS和密码子优化: 使用流感病毒的
血凝素(HA) 基因,并应用不同的密码子优化策略(iCodon、LinearDesign)来生成具有不同核苷酸组成的CDS。- 结果:在所有七种测试的
CDS中,A7都显著提高了蛋白质输出。
- 结果:在所有七种测试的
- m5C修饰: 测试元件与
4.2.8. 与circRNA的稳定性比较
- RNA半衰期测量: 在
HepG2和HCT116细胞中,通过RT-qPCR测量A7S线性mRNA与circRNA的RNA半衰期。- 结果:
A7S线性mRNA的半衰期(HepG2中15.9h,HCT116中19.0h)与circRNA(HepG2中15.1h,HCT116中19.5h)相当,远高于对照线性mRNA。
- 结果:
- 蛋白质水平比较: 测量
荧光素酶蛋白质水平随时间的变化。- 结果:
circRNA早期翻译效率低,总蛋白质输出(AUC)与对照线性mRNA相当。A7S线性mRNA在所有时间点均显示出更高的蛋白质生产,总蛋白质输出(AUC)比circRNA高5.3倍(HepG2)和5.8倍(HCT116)。
- 结果:
- 免疫原性: 通过
RT-qPCR测量ISG15和IFIT2水平,确认A7S线性mRNA和circRNA均未触发先天免疫反应。
4.2.9. 体内持续蛋白质表达
- 动物模型: 对雄性小鼠(8周龄)进行实验。
- 递送: 通过尾静脉注射
LNP封装的修饰荧光素酶mRNA(2 µg)。 - 生物发光成像: 在第
1, 3, 7, 10, 13天进行生物发光成像(bioluminescence imaging),追踪荧光素酶表达。在第14天处死小鼠,进行离体器官成像。-
结果:含有
A7S的mRNA在第1天产生比对照线性mRNA高7倍、比circRNA高108倍的发光强度。到第3天,差异更显著(A7S比对照线性mRNA高380倍,比circRNA高688倍)。A7S线性mRNA的荧光素酶表达持续到第13天,甚至在第14天仍在肝脏中可检测到。
该图像是多幅示意图,展示了不同RNA序列(Lin-Ctrl、CircRNA和Lin-A7S)在HepG2和HCT116细胞中相对RNA水平及其发光活性的变化,并通过成像显示其在小鼠体内的分布和强度。各组的亮度数据和图像也呈现于图i、图j与图k中。
Figure 6 展示了A7赋予线性mRNA类似circRNA的稳定性。
-
图:线性mRNA(Lin-Ctrl和Lin-A7S)和circRNA格式的荧光素酶报告基因构建体示意图。
图:HepG2细胞中荧光素酶RNA水平随时间的变化(电穿孔后12h, 18h, 24h, 30h),通过RT-qPCR测量。A7S线性mRNA的半衰期(15.9h)与circRNA(15.1h)相当。
图:HCT116细胞中荧光素酶RNA水平随时间的变化(电穿孔后12h, 24h, 36h, 48h),通过RT-qPCR测量。A7S线性mRNA的半衰期(19.0h)与circRNA(19.5h)相当。
图:HepG2细胞中修饰mRNA和circRNA在7天内的荧光素酶信号。A7S显著提高了蛋白质产量。
图:HCT116细胞中修饰mRNA和circRNA在7天内的荧光素酶信号。
图:HepG2和HCT116细胞中AUC值(从0天到7天)。A7S线性mRNA的总蛋白质输出比circRNA高5.3倍(HepG2)和5.8倍(HCT116)。
图:小鼠实验示意图。小鼠接受mRNA静脉注射,随后进行生物发光成像。
图:小鼠体内的生物发光成像。A7S在体内表现出持续的荧光素酶表达。
图:小鼠实验中生物发光成像的平均辐射信号。A7S导致荧光素酶表达持续到第13天。
图:第14天器官成像。
图:第14天处死小鼠后肝脏生物发光成像的平均辐射信号。
5. 实验设置
5.1. 数据集
- 病毒基因组序列: 2,678个感染脊椎动物的病毒基因组序列,来源于
NCBI病毒基因组浏览器。这些序列用于构建RNA元件筛选文库。 - 细胞系:
- HEK293T/HEK293TR: 人胚肾细胞系,用于初级筛选(
FACS富集)。 - HCT116: 人结肠癌细胞系,用于次级筛选、诱变分析、
Hire-PAT、DRS、RNA半衰期测量、免疫原性(immunogenicity)评估以及d2EGFP和HA蛋白表达分析。 - HepG2: 人肝癌细胞系,用于跨细胞类型活性评估、
RNA半衰期测量和荧光素酶表达动力学。 - A549: 人肺腺癌细胞系,用于跨细胞类型活性评估。
- MCF7: 人乳腺癌细胞系,用于跨细胞类型活性评估。
- THP1: 人单核细胞白血病细胞系,用于跨细胞类型活性评估。
- Jurkat: 人T淋巴细胞系,用于跨细胞类型活性评估。
- HeLa: 人宫颈癌细胞系,用于
ZCCHC2-KO实验和跨细胞类型活性评估。 - ZCCHC14-KO细胞和ZCCHC2-KO细胞: 用于研究元件的
TENT4辅助因子依赖性。
- HEK293T/HEK293TR: 人胚肾细胞系,用于初级筛选(
- 动物模型: 雄性小鼠(8周龄),来源于
Daehan-Biolink。用于体内生物发光成像实验,评估mRNA在体内的表达持久性。
5.2. 评估指标
本研究使用了多种评估指标来衡量RNA元件的性能和作用机制,涵盖了mRNA稳定性、翻译效率、poly(A) tail动态、免疫反应和体内效果。
5.2.1. 荧光素酶活性 (Luciferase Activity)
- 概念定义:
荧光素酶(luciferase) 是一种生物发光酶,能够催化底物发出光。通过测量发光强度,可以间接量化细胞内荧光素酶蛋白的表达水平,从而评估mRNA的翻译效率和蛋白质产出。 - 数学公式:
荧光素酶活性通常表示为相对发光单位(Relative Light Units,RLU),没有一个统一的数学公式。它通常是发光强度计读数。 - 符号解释:
- :实验组样本的发光强度。
- :对照组样本的发光强度。
- 在本文中:
荧光素酶信号通常通过将荧光素酶mRNA与海肾荧光素酶(Renilla luciferase)mRNA共转染,用海肾荧光素酶的表达作为内部对照进行标准化,以校正转染效率差异。最终结果再与无元件的对照mRNA进行标准化。
5.2.2. 流式细胞术 (Flow Cytometry)
- 概念定义:
流式细胞术(Flow Cytometry) 是一种细胞分析技术,通过测量细胞通过激光束时散射光和荧光,来量化细胞群体的特征,如d2EGFP(destabilized EGFP,不稳定的EGFP)表达水平。 - 数学公式:
流式细胞术结果通常以平均荧光强度(Mean Fluorescence Intensity,MFI)或特定荧光阳性细胞的百分比来表示,没有统一的数学公式。 - 符号解释:
- :
d2EGFP阳性细胞群体的平均荧光强度。 - 在本文中: 用于追踪
d2EGFP修饰mRNA在HCT116细胞中的表达持续时间。
- :
5.2.3. RNA水平测量 (RNA Level Measurement)
- 概念定义: 通过
RT-qPCR(逆转录定量PCR)技术,量化特定mRNA在细胞内的丰度。这用于评估mRNA的稳定性和半衰期,以及免疫反应相关基因(如ISG15和IFIT2)的表达。 - 数学公式:
RT-qPCR结果通常用或方法进行相对定量。- 相对表达量公式 (2^-(ΔΔCt) 方法): 其中,,并且 。
- 符号解释:
- :目标基因的
Ct值(扩增曲线达到阈值时的循环数)。 - :
GAPDH等内参基因的Ct值。 - :实验组的值。
- :对照组的值。
- 在本文中:
RNA半衰期通过拟合指数衰减模型(exponential decay model)并根据细胞倍增时间进行调整来计算。ISG15和IFIT2水平用于评估mRNA的免疫原性。
- :目标基因的
5.2.4. 蛋白质水平测量 (Protein Level Measurement)
- 概念定义:
Western blot(蛋白质印迹)是一种常用的分子生物学技术,用于检测和量化生物样品中特定蛋白质的表达水平。 - 数学公式:
Western blot信号强度通过图像分析软件量化,通常表示为相对于内参蛋白(如GAPDH)的相对密度单位或相对灰度值。 - 符号解释:
- :
HA蛋白条带的信号强度。 - :
GAPDH蛋白条带的信号强度。 - 在本文中: 用于量化
HA蛋白的表达水平,评估A7元件在不同CDS和密码子优化背景下的增强效果。
- :
5.2.5. Poly(A) Tail 长度分析 (Poly(A) Tail Length Analysis)
- 概念定义:
Poly(A) tail长度对mRNA的稳定性和翻译至关重要。Hire-PAT和Nanopore DRS是两种用于精确测量poly(A) tail长度及核苷酸组成的先进技术。- Hire-PAT (High-resolution poly(A) tail assay): 通过将
poly(A) tail转化为含有GI(鸟苷-肌苷)的异源聚合物,然后通过RT-PCR和片段分析来测量其长度。 - Nanopore DRS (Nanopore Direct RNA Sequencing): 直接测序
RNA分子,避免PCR偏差,通过分析离子电流信号来直接确定poly(A) tail的长度和其中的非腺苷酸掺入(混合尾)。
- Hire-PAT (High-resolution poly(A) tail assay): 通过将
- 数学公式: 无统一公式,结果通常以
poly(A) tail长度分布的直方图或中位数长度来表示。 - 符号解释:
碱基数:poly(A) tail中的核苷酸数量。- 在本文中:
DRS中通过dorado软件进行初始估计,并使用定制方法基于离子电流信号精炼poly(A) tail的5'和3'末端位置,并通过转座速度(translocation speed)将信号空间缩放到碱基数。
5.2.6. 生物发光成像 (Bioluminescence Imaging)
- 概念定义:
生物发光成像(Bioluminescence Imaging) 是一种非侵入性的体内成像技术,通过检测报告基因(如荧光素酶)产生的生物发光信号来追踪基因表达或细胞活动。 - 数学公式: 发光信号通常以
辐射度(radiance)表示,单位为(光子/秒/平方厘米/球面度)。 折叠倍数变化 (Fold Change) 的计算: - 符号解释:
- :实验组的生物发光信号强度。
- :对照组的生物发光信号强度(例如
PBS组)。 - :用于计算倍数变化的参照组信号强度(例如对照线性
mRNA组)。 - 在本文中: 用于评估
mRNA在小鼠体内荧光素酶表达的水平和持续时间。
5.2.7. 统计显著性 (Statistical Significance)
- 概念定义: 统计显著性用于判断实验观察到的差异是否可能由偶然因素引起,而不是真实的效应。
- 数学公式: 主要通过值 (
P-value) 来表示。- :通常被认为是具有统计学意义。
- :通常被认为是具有高度统计学意义。
- 符号解释:
- :值。
- 在本文中: 广泛使用
双侧学生t检验(two-sided Student's t-test)、Wald检验(Wald test)(用于log2倍数变化和调整值)和双侧Mann-Whitney U检验(two-sided Mann-Whitney U-test)(用于体内实验)。
5.2.8. 曲线下面积 (Area Under the Curve, AUC)
- 概念定义:
AUC是在曲线图(通常是蛋白质表达水平对时间)下方的面积,用于量化一段时间内总的蛋白质产出或药物暴露量。 - 数学公式:
AUC通常通过数值积分方法(如梯形法则,trapezoidal rule)来计算。 - 符号解释:
- :数据点数量。
- :在时间点 对应的蛋白质表达水平。
- 在本文中: 用于比较不同
mRNA形式(线性mRNA与circRNA)在一定时间范围内的总荧光素酶蛋白质产出。
5.2.9. Spearman相关系数 (Spearman Correlation Coefficient)
- 概念定义:
Spearman相关系数(Spearman Correlation Coefficient) 是一种非参数的统计量,用于衡量两个变量之间秩关系(monotonic relationship)的强度和方向。 - 数学公式:
- 符号解释:
- :
Spearman相关系数。 - :两个变量中第 个数据点的
秩次(rank)差。 - :数据点的数量。
- 在本文中: 用于评估次级筛选结果的
重复性(reproducibility),在不同重复实验的UMI计数之间计算。
- :
5.3. 对比基线
本研究将自己发现的RNA元件与以下基线模型和对照进行了比较:
- Control UTR (对照UTR): 包含质粒来源区域和
miR-1结合位点的UTR序列,作为通用对照。 - mRNA-1273 UTR: 来源于
COVID-19疫苗mRNA-1273(Moderna疫苗)的3'UTR,该UTR来源于人α-珠蛋白(HBA)基因。 - BNT162b2 UTR: 来源于
COVID-19疫苗BNT162b2(辉瑞/BioNTech疫苗)的3'UTR,是人AES UTR和mtRNR基因的融合体。 - Previously identified viral elements (K1-K9): 作者团队先前筛选到的病毒元件,用于评估它们在修饰
mRNA背景下的活性,结果显示大多数丧失活性。K3和K4作为部分活性对照。 - Circular RNA (circRNA, 环状RNA): 一种已知具有高稳定性的替代
RNA形式。本研究使用优化过的circRNA,包含HRV-B3 IRES和HBA 3'UTR。用于比较A7线性mRNA的稳定性和翻译效率。 - Unmodified mRNAs (未修饰mRNA): 未经过碱基修饰的
mRNA,用于比较修饰mRNA的优越性。 - Inactive mutants (非活性突变体): 如
K4m和K5m,用于作为筛选中的阴性对照,确保筛选的特异性。 - PBS (Phosphate-buffered saline): 在体内实验中作为注射对照。
6. 实验结果与分析
本节详细阐述了论文的实验结果,并对核心发现进行了深入分析。
6.1. 核心结果分析
6.1.1. 已知UTR元件与m1Ψ修饰的兼容性有限
研究首先证实了修饰mRNA相比未修饰mRNA具有优越的性能(图1a),这与之前报道一致,尤其在脂质纳米颗粒 (LNP) 递送时效果更显著,可能是由于避免了TRIM25介导的抑制。然而,当测试商业COVID-19疫苗中使用的3'UTR(如mRNA-1273和BNT162b2的3'UTR)时,它们在修饰mRNA中的表现并不理想,甚至不如对照UTR或仅略微提高表达(图1b)。更重要的是,作者团队先前发现的病毒元件(K1-K9)中,大多数在修饰mRNA背景下丧失了活性,仅有K3和K4保留了部分功能(图1c)。这突出表明,需要识别能够与碱基修饰兼容的新型RNA稳定性增强剂。
6.1.2. 系统性筛选发现m1Ψ兼容的病毒RNA元件
通过对196,277个病毒序列进行两阶段大规模筛选,研究成功识别出11个显著增强修饰mRNA稳定性和翻译的元件(A1-A11)。初级筛选(基于FACS富集GFP高表达细胞)初步筛选出约10,784个候选序列。次级筛选(基于修饰IVT mRNA转染和RNA测序分析的log2倍数变化)进一步鉴定了131个显著增强mRNA稳定性的tile(调整值 < 0.001,log2倍数变化 > 0.4),这些tile聚类形成11个稳定元件(图1e,f)。验证实验显示,在修饰mRNA中,A1, A2, A4, A6, A7五个元件保留了超过60%的活性,证明了它们的兼容性。其中,许多短片段形式(A1S, A4S, A5S, A6S, A7S, A9S, A10S, A11S)甚至表现出与完整197 nt序列相当或更高的活性,表明它们包含了核心功能基序(图1g,h)。
该图像是插图,展示了不同RNA元素在mRNA稳定性影响下的荧光素酶活性及筛选过程。在g和h图中,m1ψ 相较于对照显示了增强的稳定性,且通过数据分析和筛选确定了候选RNA元素。
Figure 1 展示了系统性筛选病毒元件以增强修饰mRNA的过程。
图:未修饰()和修饰(和m5C)IVT mRNA在5天内的荧光素酶信号。显示出优越性能。
图:3'UTR报告基因IVT mRNA的荧光素酶信号。mRNA-1273和BNT162b2的3'UTR表现不佳。
图:转染3天后未修饰或修饰荧光素酶mRNA的荧光素酶活性。已知元件在修饰mRNA中大多失活。
图:病毒序列被平铺到EGFP基因的3'UTR,并整合到HEK293TR细胞中进行初级筛选(FACS分选高GFP荧光细胞)。富集的oligos``PCR扩增并克隆到luciferase CDS的3'UTR中进行次级筛选。
图:次级筛选数据,轴为 RNA水平的log2比值,轴为0h UMI计数log2值。橙色标记的稳定tile来自11种病毒。
图:按排名排序的单个元件的log2倍数变化()。橙色标记稳定元件,黑色线突出显示选定的验证候选元件。
图:在HCT116细胞中验证22个选定tile(A1-A11及其短片段),包括未修饰和修饰mRNA。
图:在HCT116细胞中验证22个选定tile(A1-A11及其短片段),包括未修饰和修饰mRNA。短片段形式的活性。
6.1.3. 结构特征与TENT4依赖机制
这11个元件来源于不同的病毒家族(图2a),但10个元件(除A7外)都共享一个CNGG基序的环状结构(图2b)。A7是唯一的例外,它不含CNGG基序,而是形成两个由内部环(internal loop)分隔的茎环(stem loops),暗示其作用机制可能不同。
深层诱变分析揭示了这些元件的关键结构和序列特征(图3)。例如,A7采用分支结构,其中内部环(IL)包含AGACCY基序,茎环2(SL2)包含GGGGNARUD基序,这两个基序对A7的稳定功能至关重要。其他元件的CNGGN五联环中,C, G, G(1, 3, 4位)核苷酸是关键。
该图像是示意图,展示了多种病毒的基因组特征,包括HCMV、HBV、Turkey calicivirus等。这些序列的长度和结构特征对于理解RNA稳定性增强剂的筛选过程至关重要。
Figure 2 展示了RNA稳定性增强元件的基因组位置和预测的RNA结构。
图:修饰mRNA中增强基因表达的病毒元件的基因组组织和位置。
图:预测的RNA结构。除A3外,所有其他元件的RNA结构均使用EternaFold预测。
机制研究证实,所有11个元件的增强作用都被TENT4抑制剂RG7834抑制,表明它们都依赖于TENT4(图4a,b)。Hire-PAT和纳米孔DRS进一步显示,这些病毒元件能促使poly(A) tail延长,甚至超过原始长度,并且掺入非腺苷酸形成混合尾,这种效应也完全依赖于TENT4(图4c,d)。
辅助因子分析发现,所有含有CNGG环的元件()都严格依赖ZCCHC14,在ZCCHC14-KO细胞中失活。而A7在ZCCHC14-KO和ZCCHC2-KO细胞中都保持活性,表明它可能通过一种未识别的适配蛋白招募TENT4(图4a,e,g,h)。这使得A7成为RNA稳定性增强剂中一个独特类别。
6.1.4. A7的广谱活性和分子环境适应性
A7及其短片段A7S在多种细胞类型(HepG2, A549, MCF7, Jurkat, HeLa)中表现出最强和最广泛的增强活性,仅在THP1细胞中活性较低,表明其具有跨谱系的通用性(图5a)。A7S还与m5C修饰兼容,这进一步拓宽了其应用范围(图5b)。
与商业疫苗UTR相比,A7S显著提高了蛋白质产量,在转染后第3天和第5天分别带来65倍和114倍的蛋白质增加,AUC值也高出4-6倍(图5c)。
此外,A7的活性不受5'UTR(如mRNA-1273的5'UTR)、编码序列长度(使用d2EGFP)、密码子优化策略(多种HA基因的密码子优化)、RNA二级结构、尿苷含量或翻译位置(游离或ER相关核糖体)的影响(图5d,e,f,g,h)。这种卓越的稳健性使得A7成为一个高度通用的IVT mRNA性能增强工具。
该图像是多幅图表,展示了不同 RNA 元素对荧光素酶活性的影响及其 mRNA 稳定性。图 a 和 e 详细说明了在 96 小时内的荧光素酶活性,图 c 和 g 则比较了各种 RNA 处理条件下的信号强度。图 d 展示了不同 RNA 元素的尾部长度分布,图 h 说明了含有 CNGG 动机的元件与 mRNA 稳定性之间的关系。
Figure 5 展示了A7元件在不同分子背景下的功能。
图:在HepG2, A549, MCF7, THP1, Jurkat, HeLa细胞中,代表性元件(修饰mRNA)的荧光素酶表达。A2和A7S在多细胞系中表现出强大的活性。
图:转染4天后m5C修饰荧光素酶mRNA的荧光素酶活性。仅A7S在m5C修饰下仍功能。
图:转染后1, 3, 5天3'UTR报告基因的荧光素酶信号。A7S显示出比mRNA-1273和BNT162b2更强的蛋白质生产。
图:含有A7S元件的d2EGFP mRNA报告基因构建体示意图。
图:HCT116细胞中修饰d2EGFP mRNA(含HBA UTR和A7S元件)的d2EGFP表达(第1天至第5天),通过流式细胞术测量。A7S显著延长了GFP信号的持续时间。
图:含有A7元件的HA报告基因IVT mRNA构建体示意图。
图:使用Western blot分析各种密码子优化CDS的HA蛋白表达量。A7在所有CDS中均显著提高HA蛋白表达。
图:使用Western blot分析HA蛋白表达量。
6.1.5. A7使线性mRNA与circRNA具有可比稳定性但翻译效率更高
RNA半衰期测量显示,A7S线性mRNA的半衰期(在HepG2细胞中为15.9h,HCT116细胞中为19.0h)与circRNA的半衰期(在HepG2细胞中为15.1h,HCT116细胞中为19.5h)相当,且远高于对照线性mRNA(图6b,c)。
在蛋白质水平上,尽管circRNA具有更长的半衰期,但其早期翻译效率较低,导致总蛋白质输出(AUC)与快速衰减的对照线性mRNA相当。相比之下,A7S线性mRNA在所有时间点都显示出显著更高的蛋白质生产,其总蛋白质输出AUC比circRNA高出5.3倍(HepG2)和5.8倍(HCT116)(图6d,e,f)。这表明A7不仅赋予线性mRNA``circRNA级别的稳定性,而且显著提高了翻译效率。此外,A7S线性mRNA和circRNA均未触发ISG15和IFIT2等免疫反应基因的表达(Extended Data Fig. 7b),证实了它们的低免疫原性。
6.1.6. A7实现体内持续蛋白质表达
在小鼠体内实验中,含有A7S的mRNA在第1天就产生了比对照线性mRNA高~7倍、比circRNA高108倍的生物发光强度。到第3天,这种差异更加显著(380倍于对照线性mRNA,688倍于circRNA)。尽管circRNA的信号衰减速度慢于对照线性mRNA,但其强度始终低于A7S线性mRNA。最重要的是,含有A7S的RNA在体内维持荧光素酶表达长达13天,甚至在第14天处死小鼠后,肝脏中仍能检测到荧光素酶信号(图6h,i,j,k)。这强有力地证明了A7显著增强了线性mRNA在体内的表达持久性。
6.2. 数据呈现 (表格)
本论文未提供需转录的Markdown或HTML格式表格,所有数据均以图表形式呈现。
6.3. 消融实验/参数分析
-
深层诱变分析 (Deep Mutagenesis Analysis):
- 通过对
A1S, A2, A4, A6, A7进行单核苷酸替换、删除、补偿性突变、插入和双替换等4,542种突变,揭示了元件内部的关键结构和序列特征(图3)。 - 例如,
A7的内部环(IL)中的AGACCY基序和茎环2(SL2)中的GGGGNARUD基序被确定为其稳定功能的关键。 - 其他
CNGGN五联环元件中,C, G, G(1, 3, 4位)核苷酸是功能核心。 - 环的大小也影响元件功能,
5nt环比4nt或6nt环更活跃。 - 这些分析不仅帮助精确预测了
RNA二级结构(例如A7的实际结构与EternaFold预测不同),也提供了优化元件的依据。
- 通过对
-
TENT4抑制剂和辅助因子敲除实验:
- TENT4抑制: 使用
RG7834(TENT4抑制剂)处理细胞,发现所有11个元件的增强作用均被消除(图4a,b),证实了它们对TENT4的依赖性。这是一种功能性的消融实验,去除了TENT4的功能,观察到元件活性的消失。 - ZCCHC14/ZCCHC2敲除: 在
ZCCHC14-KO和ZCCHC2-KO细胞系中测试元件活性。-
结果显示,所有含有
CNGG基序的元件()在ZCCHC14-KO细胞中失活,但在ZCCHC2-KO细胞中功能正常(图4a,e),表明它们严格依赖ZCCHC14。这有效地“消除了”ZCCHC14的作用,揭示了元件的辅助因子特异性。 -
A7在两种KO细胞系中都保持活性(图4a,e),表明它不依赖已知的TENT4辅助因子ZCCHC14或ZCCHC2,暗示存在未识别的适配蛋白。这进一步对A7的独特机制进行了“消融”式分析。这些实验共同构成了对元件功能组分、关键结构域及其作用机制的深入分析,验证了模型(元件)中各组件(如
CNGG基序、IL和SL2区域)的有效性和重要性。
-
- TENT4抑制: 使用
7. 总结与思考
7.1. 结论总结
本研究通过对196,277个病毒序列进行大规模、系统性筛选,成功识别出11个能够显著增强修饰mRNA稳定性和翻译效率的RNA元件。这些元件通过招募TENT4酶,促进poly(A) tail的延长和混合加尾,从而有效阻止去腺苷酸化。其中,A7元件表现出卓越的性能,其作用机制不依赖于已知的TENT4辅助因子ZCCHC14和ZCCHC2。A7在多种细胞类型、不同碱基修饰(包括和m5C)、以及多样化的分子背景(5'UTR、CDS、密码子优化等)下均保持稳健活性。在体外实验中,含有A7的线性mRNA达到了与circRNA相当的稳定性,同时翻译效率显著更高。更重要的是,在小鼠体内,A7能够使线性mRNA实现持续超过2周的蛋白质表达。这些发现为开发高效、持久、低免疫原性且易于制造的线性mRNA治疗平台提供了简单而强大的解决方案。
7.2. 局限性与未来工作
- TENT4偏倚性: 尽管所有
11个元件都依赖TENT4,但作者承认其筛选方案可能对TENT4介导的调控机制存在偏倚。这不排除存在其他非TENT4依赖的RNA稳定性增强机制未被发现的可能性。 - A7辅助因子的未识别:
A7的独特之处在于不依赖ZCCHC14或ZCCHC2,这表明其可能招募了尚未识别的TENT4适配蛋白。未来工作需要深入研究并鉴定这个未知的辅助因子,这将有助于全面理解A7的作用机制,并可能发现新的RNA调控通路。 - 体内进一步表征: 尽管
A7在小鼠模型中表现出卓越的体内持久性,但仍需要进一步的体内表征,包括不同给药途径、剂量响应、长期安全性、药代动力学和药效学研究,以支持其未来的临床转化应用。 - 作用机制的精细化:
深层诱变分析虽然揭示了关键结构和序列特征,但对于这些特征如何精确地招募TENT4或其辅助因子,以及如何在分子水平上调控混合加尾,仍需更精细的结构生物学和生化研究。 - 跨物种和疾病模型的验证:
A7在小鼠肝脏中表现良好,但在其他器官、不同动物模型或人类疾病模型中的表现仍需验证。
7.3. 个人启发与批判
7.3.1. 个人启发
- 病毒作为生物学工具的宝库: 这项研究再次强调了病毒作为生物学工具的巨大潜力。病毒为了在宿主细胞中生存和复制,演化出了极其精妙的机制来劫持或操纵宿主细胞通路。系统性地挖掘病毒基因组,可以发现意想不到的调控元件,为生物技术和医学应用提供灵感。
- 克服技术瓶颈的策略:
mRNA疗法面临的核心瓶颈是稳定性、翻译效率和免疫原性。本研究通过“兼容碱基修饰”这一核心设计理念,直接解决了现有解决方案的痛点,展示了在技术发展中聚焦核心限制因素的重要性。 - A7的巨大应用潜力:
A7元件的通用性(跨细胞类型、修饰兼容、分子环境适应性)和强大效果(高稳定性、高翻译效率、体内持久性)使其成为mRNA疗法领域的“游戏规则改变者”。它有望显著简化mRNA的开发和制造,降低成本,并拓宽mRNA的应用范围,特别是对于需要长期蛋白质表达的基因替代疗法、免疫疗法和组织重编程。 - 机制研究的重要性: 仅仅发现功能性元件是不够的,深入理解其作用机制(
TENT4依赖的混合加尾)为进一步优化和设计新的RNA元件奠定了基础。A7的独特机制暗示了RNA调控的复杂性和更多未知领域的存在。 - 线性mRNA的复兴: 过去,
circRNA因其稳定性被寄予厚望,但翻译效率低是其硬伤。A7的发现有望“复兴”线性mRNA,使其在性能上超越甚至替代部分circRNA应用,同时保持线性mRNA制造的简便性优势。
7.3.2. 批判
- 筛选范围的泛化性: 尽管筛选了
196,277个病毒序列,这已经非常庞大,但这些病毒主要感染脊椎动物。是否存在其他生物界(如植物病毒、昆虫病毒)中更强大或机制更独特的RNA稳定性元件?这项研究的发现是否能完全代表所有可能存在的天然增强剂? - TENT4机制的独占性: 所有的
11个阳性元件都依赖TENT4,这可能反映了TENT4在脊椎动物细胞mRNA后转录调控中的主导作用。然而,这也可能是筛选条件(例如,选择HCT116细胞、修饰mRNA)导致的偏向性。未来可以探索在不同细胞类型或生理条件下,是否存在其他不依赖TENT4的RNA稳定机制。 - A7机制的黑箱:
A7不依赖ZCCHC14或ZCCHC2,但仍依赖TENT4,这意味着存在一个未知的TENT4适配蛋白。这个“黑箱”是当前研究的一个重要局限。在不完全了解其精确分子机制的情况下,对A7进行进一步的合理设计和优化可能会受限。 - 体内免疫原性与安全性: 论文提到了
A7线性mRNA未触发ISG15和IFIT2表达,但在复杂的体内环境中,尤其是在长期或重复给药的情况下,是否会引发其他形式的免疫反应或潜在的毒性(例如,TENT4作为宿主蛋白,持续的poly(A) tail延长是否会影响内源性mRNA平衡)仍需详尽评估。 - A7的紧凑性与最小化: 论文发现短片段
A7S与长片段A7活性相当,但A7S仍有155 nt。是否能进一步将A7的核心功能基序最小化,以提高mRNA的转录效率和降低潜在的免疫原性(通常越短的RNA元件越不容易被识别)?更短的元件也有助于在空间有限的治疗性mRNA中进行整合。
相似论文推荐
基于向量语义检索推荐的相关论文。