Directed evolution of an orthogonal transcription engine for programmable gene expression in eukaryotes
TL;DR 精炼摘要
本研究通过定向进化技术,成功创建了一种融合T7 RNA聚合酶与非洲猪瘟病毒加帽酶的正交转录引擎。这一新型引擎在酵母及哺乳动物细胞中实现了比野生类型高出两个数量级的转录活性,显著提升了可编程基因表达的能力,为合成生物学提供了可调控的工具。
摘要
Engineered T7 RNAP fused with a capping enzyme co-transcriptionally caps RNA in eukaryotes. Directed evolution enhanced T7 polymerase fusion activity by two orders of magnitude. Programmable and orthogonal gene expression is demonstrated in yeast and mammalian cells. Capping-T7 offers tunable and scalable control for synthetic biology applications.
思维导图
论文精读
中文精读
1. 论文基本信息
1.1. 标题
定向进化一个正交转录引擎,用于真核生物中可编程的基因表达 (Directed evolution of an orthogonal transcription engine for programmable gene expression in eukaryotes)
1.2. 作者
Shaunak Kar, Elizabeth C. Gardner, Kamyab Javanmardi, Daniel R. Boutz, Raghav Shroff, Andrew P. Horon, Thomas H. Segall-Shapiro, Andrew D. Ellington, Jimmy Gollihar
隶属机构:
- Institute and Department of Pathology and Genomic Medicine, Houston Methodist Hospital, Houston, TX, USA
- Department of Bioengineering, Rice University, Houston, TX, USA
- Department of Molecular Biosciences, The University of Texas at Austin, Austin, TX, USA
- Center for Systems and Synthetic Biology, The University of Texas at Austin, Austin, TX, USA
1.3. 发表期刊/会议
该论文发布于 iScience,这是一个跨学科的开放获取期刊,涵盖生命、物理和地球科学。该期刊在科学界具有良好的声誉和影响力,发表高质量的原创研究。
1.4. 发表年份
2024年12月6日
1.5. 摘要
T7 RNA聚合酶 (T7 RNAP) 已被广泛应用于原核生物中基因表达的正交控制。然而,T7 RNAP转录的RNA缺乏5'端甲基鸟苷帽 (5' methyl guanosine caps),这严重限制了其在真核生物系统中的应用。为了解决这一不足,本研究利用酿酒酵母 (Saccharomyces cerevisiae) 平台,定向进化了一种融合酶,该酶将T7 RNAP与非洲猪瘟病毒 (African swine fever virus) 的单亚基加帽酶融合。研究成功分离出具有高活性的融合酶变体,其蛋白质表达水平比野生型融合酶高出约两个数量级。本研究在酵母和哺乳动物细胞中展示了使用T7 RNAP基因回路实现可编程和正交的基因表达。这种加帽-T7 (Capping-T7) 系统为合成生物学应用提供了可调节和可扩展的控制能力。
1.6. 原文链接
/files/papers/69215d363f69abbc8fd2082e/paper.pdf (已正式发表)
2. 整体概括
2.1. 研究背景与动机
基因表达 (gene expression) 的正交控制 (orthogonal control) 是合成生物学 (synthetic biology) 的一个核心目标,尤其是在构建复杂基因回路 (genetic circuitry) 时。T7 RNA聚合酶 (T7 RNAP) 因其高度特异性、高转录效率以及与宿主转录机制的独立性,长期以来一直是原核生物中重组蛋白生产和基因回路构建的基石。然而,将T7 RNAP系统移植到真核生物中面临巨大挑战。
核心问题:
- 真核生物的基因表达机制远比原核生物复杂,依赖于宿主因子 (host factors),如转录因子 (transcription factors) 和多蛋白RNA聚合酶复合体 (multi-component RNA polymerase holoenzymes)。这使得在真核生物中实现可预测和正交的基因表达控制非常困难。
- 真核生物的信使RNA (mRNA) 必须经过关键的转录后修饰 (post-transcriptional modifications) 才能有效翻译、核输出 (nuclear export) 和维持稳定性,其中最重要的是在5'端添加甲基鸟苷帽 (5' methyl guanosine cap, 简称5' cap) 和在3'端添加多聚腺苷酸尾 (polyA tail)。T7 RNAP产生的转录产物自然缺乏这些修饰。
- 尽管先前的工作尝试通过融合T7 RNAP与病毒加帽酶 (viral capping enzymes) 来解决5'加帽问题,并取得了一定进展,但这些融合酶的活性仍然较低,蛋白表达水平远低于内源性核表达,且其在非哺乳动物真核宿主中的性能尚未得到全面评估。
现有研究的挑战或空白 (Gap): 现有T7 RNAP-加帽酶融合系统在真核生物中的活性不足,限制了其广泛应用,且缺乏跨真核宿主系统的通用性验证。
本文的切入点或创新思路: 通过定向进化 (directed evolution) 的策略,在酿酒酵母这一模型真核生物中,大幅提升T7 RNAP与病毒加帽酶 (NP868R) 融合酶的活性,使其能够高效生成具有5'帽的mRNA,从而在真核细胞中实现高水平、可编程、正交的基因表达。
2.2. 核心贡献/主要发现
本研究的主要贡献和关键发现包括:
- 开发并定向进化了新型融合酶 (NPT7): 成功构建并利用酿酒酵母平台定向进化了T7 RNAP与非洲猪瘟病毒加帽酶NP868R的融合酶 (命名为
NPT7)。 - 显著增强的酶活性: 通过多轮选择,分离出两种高活性变体 和 ,其在酵母中的蛋白质表达水平比野生型 (WT) 融合酶高出近两个数量级 (two orders of magnitude)。
- 实现可编程和正交的基因表达:
- 在酵母中展示了使用
NPT7变体实现基因表达的可预测和可调控控制,包括通过诱导剂浓度和T7启动子 (T7 promoter) 强度对表达水平的微调。 - 成功构建并演示了多路复用 (multiplexed) 和正交 (orthogonal) 的基因表达回路,其中不同荧光蛋白的表达可以独立控制。
- 在酵母中展示了使用
- 跨真核宿主的可移植性与增强性能: 验证了在酵母中进化的
NPT7变体 (v433和v443) 在哺乳动物 HEK293T 细胞中也表现出增强的活性,比野生型高3-4倍,表明其具有跨真核生物界 (inter-kingdom) 的通用性。 - 为合成生物学提供强大工具: 这一“加帽-T7”系统代表了合成生物学领域的一个重大进步,为在各种真核生物中构建复杂、稳健且独立于宿主因子的基因回路提供了新的、可扩展的解决方案。
3. 预备知识与相关工作
3.1. 基础概念
3.1.1. T7 RNA聚合酶 (T7 RNAP)
- 概念定义: T7 RNAP是一种来源于T7噬菌体 (bacteriophage T7) 的单亚基DNA依赖性RNA聚合酶 (DNA-dependent RNA polymerase)。
- 特点: 它以其极高的特异性、转录效率和对特定17碱基对 (17 bp) 启动子 (promoter) 的识别能力而闻名。T7 RNAP独立于宿主细胞的转录机制,这使其成为构建正交基因表达系统 (orthogonal gene expression system) 的理想工具。
- 应用: 在生物技术中广泛用于重组蛋白生产,尤其是在原核生物如大肠杆菌 (Escherichia coli) 中。
3.1.2. 正交基因表达 (Orthogonal Gene Expression)
- 概念定义: 指的是一个基因表达系统能够独立于宿主细胞的内源性 (endogenous) 调节机制而运作,两者之间几乎没有或完全没有相互干扰。
- 意义: 在合成生物学中,正交性对于构建复杂、可预测且稳健的基因回路至关重要,因为它允许研究人员精确控制特定基因的表达,而不会意外地影响宿主细胞的生理功能。
3.1.3. 5'甲基鸟苷帽 (5' Methyl Guanosine Cap, 5' Cap)
- 概念定义: 真核生物mRNA分子5'端的一种特有结构,通常是7-甲基鸟苷 (7-methylguanosine) 通过5'-5'三磷酸键连接到mRNA的第一位核苷酸上。
- 功能: 5'帽对于真核生物mRNA的翻译起始、稳定性、核输出和剪接 (splicing) 都至关重要。没有5'帽的mRNA在真核细胞中通常不能被有效翻译,且易于降解。
3.1.4. 转录后修饰 (Post-transcriptional Modifications)
- 概念定义: 指的是RNA分子在转录 (transcription) 完成后,其结构和功能发生的一系列化学修饰。
- 真核生物mRNA的关键修饰:
- 5'加帽 (5' Capping): 在mRNA的5'端添加5'帽,如上所述。
- 3'多聚腺苷酸化 (3' Polyadenylation): 在mRNA的3'端添加一段多聚腺苷酸尾 (polyA tail)。
- 重要性: 这些修饰是真核生物基因表达调控的关键环节,确保mRNA的正确处理、运输和翻译。
3.1.5. 定向进化 (Directed Evolution)
- 概念定义: 一种模拟自然选择过程的实验室技术,用于改造蛋白质或核酸,以获得特定所需的功能。
- 流程: 通常包括三个主要步骤:
- 文库构建 (Library Generation): 通过随机突变 (random mutagenesis) 或基因重组 (recombination) 创建大量变体。
- 筛选/选择 (Screening/Selection): 识别并分离出具有增强或改变功能的变体。
- 扩增 (Amplification): 扩增选出的变体并重复上述循环,直到获得所需功能。
- 应用: 广泛用于酶工程、蛋白质功能研究和生物传感器开发。
3.1.6. 酿酒酵母 (Saccharomyces cerevisiae)
- 概念定义: 一种单细胞真核微生物,俗称面包酵母或啤酒酵母。
- 特点: 具有易于培养、遗传操作简单、基因组测序完整且拥有真核细胞的基本特征等优点。
- 应用: 广泛用作模式生物 (model organism) 进行分子生物学、遗传学和合成生物学研究。
3.1.7. HEK293T 细胞
- 概念定义: 一种常用的、来源于人胚肾细胞 (human embryonic kidney cells) 的永生化 (immortalized) 细胞系。
- 特点: 易于培养和转染 (transfection),常用于病毒载体生产、基因表达研究和药物筛选。
- 应用: 在本研究中作为哺乳动物细胞模型,验证在酵母中进化的酶的跨界功能。
3.2. 前人工作
- T7 RNAP在原核生物中的成功应用: Studier 和 Moffatt 等人在20世纪80年代奠定了T7 RNAP作为重组蛋白表达系统基石的地位。T7 RNAP因其高特异性和与宿主转录机制的独立性,被广泛应用于原核生物如大肠杆菌中,并在此基础上构建了复杂的基因回路。
- T7 RNAP在真核生物中的挑战: 尽管T7 RNAP在原核生物中表现出色,但将其直接应用于真核生物面临5'加帽的巨大障碍。早期尝试将T7 RNAP导入酵母细胞核,并试图通过融合RNA聚合酶II (Pol II) 相关的信号域来招募宿主加帽机制,但均未成功实现可观的蛋白质表达。这表明T7 RNAP转录产物需要独立于宿主机制的加帽。
- 病毒加帽酶的引入: 病毒加帽酶,如痘苗病毒加帽酶 (Vaccinia Capping Enzyme, VCE),被发现能够在不依赖宿主加帽机制的情况下催化帽的形成。因此,共表达 (co-expression) T7 RNAP和VCE被证明可以在人类细胞质中产生有帽的T7转录mRNA并进行翻译。然而,这种共表达系统的效率不高,有帽转录本的水平远低于无帽转录本,可能因为其非协调的活性。
- T7 RNAP-加帽酶融合酶的早期尝试: 为了提高效率,研究人员探索了T7 RNAP与加帽酶的融合。Jaïs 等人 (2019) 首次展示了T7 RNAP和VCE的融合酶可以在哺乳动物细胞质中介导蛋白质表达,并且比非连接酶表现出更高的蛋白质表达。他们还评估了其他加帽酶作为融合伴侣,发现来自非洲猪瘟病毒的NP868R加帽酶在HEK293T细胞中表现出最高的蛋白质表达。
- 现有融合酶的局限性: 尽管这些融合酶取得了进展,但其蛋白质表达水平仍远低于内源性核表达的报告蛋白。这意味着现有融合酶的功能仍有很大的提升空间。此外,这些融合酶的性能主要在哺乳动物细胞中得到验证,其在其他真核宿主中的通用性尚不明确。
3.3. 技术演进
领域技术演进脉络如下:
- T7 RNAP在原核生物中的广泛应用: 奠定T7 RNAP作为正交转录工具的基础。
- 尝试将T7 RNAP移植到真核生物: 遇到真核生物mRNA加工(特别是5'加帽)的障碍。
- 利用病毒加帽酶解决加帽问题: 通过共表达T7 RNAP和病毒加帽酶实现部分加帽,但效率低下。
- T7 RNAP与病毒加帽酶的融合: 提高了加帽和表达效率,但活性仍不理想,且主要在哺乳动物细胞中验证。
- 本研究的创新: 在前人工作的基础上,通过定向进化在酵母中大幅优化T7 RNAP-NP868R融合酶的活性,并首次验证其跨真核生物界的可移植性,从而显著提升了该工具的实用性和通用性。
3.4. 差异化分析
本文的工作与相关工作中的主要方法相比,核心区别和创新点在于:
- 定向进化策略: 之前的研究主要集中在筛选不同的加帽酶融合伴侣或优化融合结构,而本研究则通过系统的定向进化方法,在酵母中对T7 RNAP-NP868R融合酶进行突变和筛选,从而获得了活性大幅提升的变体。这种方法能够探索更大的序列空间,发现非直观的优化。
- 活性大幅提升: 本研究得到的进化变体 (v433, v443) 的蛋白质表达水平比野生型融合酶高出近两个数量级,远超之前报道的性能。这解决了早期融合酶活性较低,限制其广泛应用的核心痛点。
- 跨界通用性验证: 本文不仅在酵母这一非哺乳动物真核宿主中进行了进化和验证,还进一步在哺乳动物 HEK293T 细胞中展示了这些进化变体的增强性能,证明了其在不同真核宿主中的通用性和可移植性,扩展了其潜在应用范围。
- 可编程和正交基因表达的全面演示: 本文详细展示了利用进化型融合酶在酵母中实现基因表达的可调控性、多路复用能力和正交性,为构建复杂的真核基因回路提供了更强大的工具。
4. 方法论
4.1. 方法原理
本文的核心原理是利用定向进化来优化一个融合酶,该融合酶由噬菌体 T7 RNA 聚合酶 (T7 RNAP) 和非洲猪瘟病毒加帽酶 NP868R (African swine fever virus capping enzyme NP868R) 组成,以克服 T7 RNAP 在真核生物中无法生成有帽 mRNA 的限制。通过在酵母中进行随机突变和高通量筛选,研究旨在获得能够高效合成功能性、5'端加帽 mRNA 的变体,从而在真核细胞中实现独立于宿主转录和加帽机制的可编程基因表达。最终,该系统可用于在多种真核生物中实现精准、可调控且正交的基因表达。
4.2. 核心方法详解
4.2.1. NPT7 融合酶的构建与酵母系统建立
研究首先构建了一个包含 NP868R 和 T7 RNAP 的融合酶,命名为 NPT7。为了实现高效的细胞核定位 (nuclear localization) 和功能,该融合酶设计时融入了以下关键组分:
-
甘氨酸-丝氨酸接头 (Glycine-serine linker): 用于连接 NP868R 和 T7 RNAP 两个结构域,确保它们在融合后仍能保持各自的功能并协作。
-
N端核定位信号 (N-terminal Nuclear Localization Signal, NLS): 确保融合酶能够高效地从细胞质进入细胞核,因为在酵母中,目标报告基因 (reporter gene) 载体通常位于细胞核内。
-
半乳糖响应启动子 (Galactose-responsive promoter):
NPT7融合酶的表达受此启动子控制,使得其表达水平可以通过添加不同浓度的半乳糖 (galactose) 进行诱导和调节。这个表达盒被整合到酵母基因组的HO位点。同时,设计了一个报告基因结构来评估
NPT7的活性: -
荧光报告蛋白 ZsGreen: 作为指示
NPT7活性的输出信号。 -
T7 RNAP 启动子: 控制 ZsGreen 的表达,确保其转录完全依赖于
NPT7融合酶。 -
聚腺苷酸化信号 (Polyadenylation signal) 和 T7 终止子 (T7 terminator): 用于确保转录产物的正确加工和终止。
-
多拷贝酵母质粒 (Multi-copy yeast plasmid): 该报告基因被克隆到这种质粒上,以提供高拷贝数,便于检测。
当这些构建体被转化到酿酒酵母 BY4741 菌株中,并通过半乳糖诱导后,研究人员观察到与未诱导相比,蛋白质产量有2倍的增加,这表明野生型
NPT7融合酶在酵母中具有一定的活性。
为了验证加帽酶活性的关键作用,研究人员引入了 NP868R 中的点突变 K294A,该突变已知会破坏加帽功能,产生加帽“失活”或“无效”版本 (capping "dead" or null versions) 的 NPT7。这些突变酶的转化和诱导导致报告基因表达水平显著降低,从而证实了野生型融合酶的加帽活性对于蛋白质表达至关重要。
4.2.2. NPT7 融合酶的定向进化
为了提高 NPT7 融合酶的活性,研究人员采用了定向进化策略,其步骤如下:
- 文库构建 (Library Generation): 使用易错PCR (error-prone PCR) 技术对编码
NPT7的基因进行扩增。易错PCR在DNA复制过程中引入随机突变,从而产生一个包含大量NPT7变体的突变文库。 - 筛选/选择 (Selection): 将突变文库转化到含有
ZsGreen荧光报告基因的酵母菌株中。随后,利用荧光激活细胞分选 (Fluorescence-activated cell sorting, FACS) 技术对酵母细胞进行分选。FACS 能够根据细胞的荧光强度对其进行分离,从而筛选出表达最高ZsGreen荧光蛋白的细胞,这些细胞携带了活性最高的NPT7变体。 - 多轮筛选: 经过多轮的文库构建、转化和 FACS 筛选后,研究人员成功分离出两个高活性变体: 和 。
4.2.3. 进化变体的表征
对分离出的高活性变体 和 进行了详细表征:
- 活性提升评估: 发现这两个变体相对于野生型
NPT7表现出近两个数量级的荧光信号增加,表明其活性得到了显著增强。 - 基因型分析 (Genotyping): 对这两个变体的基因序列进行测序,揭示了 包含15个氨基酸突变(NP868R 结构域7个,T7 结构域8个), 包含10个氨基酸突变(NP868R 结构域2个,T7 结构域6个)。值得注意的是,两个进化变体在5个残基位置 (
K9N,D279N,H1195R,R1202H,H1667R) 上观察到趋同突变 (convergence)。 - 加帽功能验证: 再次构建了进化变体的加帽失活版本 (
capping-null variants)。结果显示,这些失活版本报告基因表达水平显著降低,再次确认了观察到的高活性主要依赖于加帽功能。然而,即使是进化变体的加帽失活版本,其报告活性也比野生型NPT7的失活版本高出10倍,这暗示了细胞核中可能存在低水平的背景加帽活性。 - 基因组目标活性测试: 进化型
NPT7变体在酵母基因组目标上没有显示出显著活性,这可能与抑制性染色质 (repressive chromatin) 条件有关。因此,所有后续测试均使用高拷贝报告质粒进行。
4.2.4. 可调控和多路复用基因表达的演示
研究人员进一步探索了进化型 NPT7 变体的可调控性 (tunability) 和多路复用 (multiplexing) 能力:
- 融合酶表达水平调控: 利用 酵母菌株,通过改变半乳糖浓度来精确控制融合酶的表达水平,从而实现了对报告基因表达的梯度调控。
- 比较内源性启动子: 将 驱动的报告基因表达水平与酵母内源性的强半乳糖响应启动子 (Gal promoter) 驱动的表达水平进行了比较,发现在多拷贝质粒上的表达水平是相当的。
- T7 启动子变体调控: 鉴于 T7 RNAP 启动子在体外和大肠杆菌中已有多项特征化的突变体,这些突变体具有不同强度。研究人员在酵母中测试了这些 T7 启动子变体与进化型
NPT7(v433 和 v443) 的结合使用。通过将ZsGreen替换为其他荧光蛋白 (BFP 和 mScarlet-l),验证了融合酶的活性不依赖于货物蛋白。结果显示,启动子变体的强度等级顺序在所有回路设计中都得到了保持,表明对基因表达的控制具有可预测性,并且正交于宿主机制。 - 多路复用回路 (Multiplexed Circuits): 设计了一个包含三个独立货物基因 (荧光蛋白
ZsGreen、mScarlet-I和BFP) 的基因回路。其中ZsGreen的表达受不同强度的 T7 启动子控制,而mScarlet-I和BFP则受野生型 T7 启动子控制。结果表明,只有ZsGreen的表达水平随启动子强度变化,而mScarlet-I和BFP的表达保持不变,这展示了在单一主调控酶控制下,独立控制多个基因表达水平的能力。
4.2.5. 正交 NPT7 变体
为了实现更高复杂度的基因回路,研究人员利用了先前工程化的 T7 RNAP 变体,这些变体能够识别不同的突变 T7 启动子,并具有最小的交叉反应性:
- 构建正交变体: 通过嫁接特定的 DNA 结合域突变 (DNA-binding domain mutations),从 构建了五个正交变体。
- 特异性验证: 每个变体都与其同源启动子 (cognate promoter) 进行测试。结果显示成功切换了启动子特异性并生成了有帽转录本,但在蛋白质生产水平上低于野生型版本,表明仍需进一步优化。
4.2.6. 在哺乳动物细胞中的验证
为了验证进化型 NPT7 变体在其他真核宿主中的性能,研究人员在 HEK293T 细胞中进行了测试:
- 构建哺乳动物表达载体: 进化变体 (v433 和 v443) 被克隆,但不包含 NLS 标签,并在 CAG 启动子 (CAG promoter) 和 β-球蛋白聚腺苷酸化信号 (beta-globulin polyadenylation signal) 的控制下表达。
- 增强活性: 在两种不同的报告基因背景下 (包含独特的 5' 和 3' UTR 序列),这些变体在 HEK293T 细胞中的报告基因表达比野生型高出3到4倍。这表明,尽管是在酵母中进化的,这些工程变体在不同的真核系统中也表现出增强的性能,具有广泛的适用性。
4.2.7. 实验模型与研究参与者细节
4.2.7.1. 微生物菌株 (Microbe strains)
- 大肠杆菌 (E. coli): ThermoFisher 公司的 DH10B 和 PIR1 菌株。在 AthenaES 的 Superior Broth 中于 摇床培养。
- 酿酒酵母 (Saccharomyces cerevisiae): ATCC 201388 的 BY4741 菌株,基因型为 MATa his3Δ1 leu2Δ met15Δ ura3Δ。在 SD 或 SD-Leu-His 培养基中于 摇床培养。
4.2.7.2. 人类细胞系 (Human cell lines)
- HEK293T: ATCC CRL-3216 细胞系。在含酚红、4 mM L-谷氨酰胺、110 mg L 丙酮酸钠、4.5 g L D-葡萄糖的 DMEM (GIBCO 11995065) 中培养,补充 FBS (Gibco 26140079) 和青霉素-链霉素 (Pen-Strep, Gibco 15140122)。在 CO
_2和 的潮湿环境中培养,每2-3天传代一次。
4.2.7.3. 质粒设计与构建 (Plasmid design and construction)
- 所有质粒的克隆和组装均采用黄金门 (Golden Gate) 克隆方法。
- DNA 序列来源: 所有合成 DNA 序列均购自 IDT (Integrated DNA Technologies)。
- 连接酶和限制酶: 使用 BsaI-HF-v2 (NEB)、Esp3I (NEB) 进行限制性消化,T7 DNA Ligase (NEB) 和 T4 DNA Ligase (NEB) 进行连接。
- 转化: 构建体转化至 DH10B 大肠杆菌细胞,通过标准化学转化程序进行。
- 抗生素选择: 根据质粒抗性基因选择卡那霉素 (50 µg/mL)、氯霉素 (34 µg/mL) 和羧苄青霉素 (100 µg/mL)。
4.2.7.4. 酵母转化 (Yeast transformations)
- 方法: 使用 ZymoResearch 的 Frozen-EZ Yeast Transformation II kit。
- 基因组整合: 2-3 µg 质粒用 NotI 酶切线性化后用于基因组整合。
- 质粒转化: 1 µg 质粒用于每 100 µL 细胞的转化。
4.2.7.5. 酵母菌株与功能测定 (Yeast strains and functional assays)
- 培养条件: 所有工程菌株在 下过夜培养20小时。
- 诱导: 将样品稀释1:10到含有 D-半乳糖(或不同浓度)和 D-棉子糖作为碳源的相应选择性培养基中,并在 下培养18小时。
- 荧光检测: 细胞用 PBSA (PBS + 1% BSA + 2 mM EDTA) 洗涤两次,稀释1:10后使用 Sony SA3800 光谱分析仪进行分析。激发波长为 405 nm、488 nm 和 561 nm,发射波长为 445-475 nm、495-510 nm 和 575-595 nm。
- 流式细胞仪分选 (FACS): 在进行定向进化时,使用 Sony SH300 分选仪对细胞进行分选,筛选出表达最高 1% ZsGreen 的细胞,并在 SD-His-Leu 培养基中验证。随后对变体进行测序以确定突变。
4.2.7.6. 细胞培养与转染 (Cell culture and transfection)
- HEK293T 细胞培养: 如前所述,在 、 CO
_2的培养箱中培养。 - 转染: 通常将 个细胞接种到24孔板中,在转染当天细胞汇合度 (confluency) 达到 。使用 Lipofectamine 3000 Transfection Reagent (Thermo Fisher) 进行转染。
- 样品处理与分析: 转染后48小时,细胞用 PBS 洗涤两次,消化后用 PBSA 重悬,并稀释1:10 后使用 Sony SA3800 光谱分析仪进行分析。
4.2.8. 关键资源表 (KEY RESOURCES TABLE)
以下是原文提供的关键资源表,其中列出了实验中使用的细菌和病毒菌株、化学品、试剂、商业试剂盒、沉积数据、细胞系、生物体/菌株、寡核苷酸、重组DNA以及软件和算法。
| REAGENT or RESOURCE | SOURCE | IDENTIFIER |
| Bacterial and virus strains | ||
| DH10B Competent cells | ThermoFisher | EC0113 |
| One Shot PIR1 competent cells | ThermoFisher | C101010 |
| Chemicals, peptides, and recombinant proteins | ||
| Superior Broth | AthenaES | 0105 |
| LB Agar | FisherScientific | BP1425-2 |
| Agar | FisherScientific | BP9744-500 |
| Carbenicilln (Disodium), USP grade | GoldBio biotechnology | C-103-5 |
| Chloramphenicol, USP grade | GoldBio biotechnology | C-105-5 |
| Kanamycin Monosulfate, USP grade | GoldBio biotechnology | K-120-5 |
| Penicillin-Streptomycin (10,000 U/mL) | Gibco | 15140122 |
| DMEM, high glucose, pyruvate | Gibco | 11995065 |
| Trypsin EDTA | ThermoFisher | 25200056 |
| Fetal Bovine Serum | GIBCO | 26140079 |
| Opti-MEM I Reduced Serum Medium, GlutaMAX Supplement | GIBCO | 51985091 |
| Lipofectamine 3000 Transfection Reagent | Thermo Fisher | L3000015 |
| Esp3l | NEB | R0734 |
| T7 DNA Ligase | NEB | M0318S |
| T4 DNA Ligase | NEB | B0202S |
| Bsal-HF-v2 | NEB | R3733L |
| Platinum SuperFi DNA polymerase | ThermoFisher | 12351010 |
| Minimal SD base | Takara | 630411 |
| YPD broth | FisherScientific | BD242820 |
| SD-Leu-Glucose powder, 250g | Sunrise science | 1799-250 |
| SD-His powder, 500g | Sunrise science | 1705-500 |
| SD-Leu powder | Sunrise science | 1707-300 |
| 20% Galactose solution | Teknova | G0515 |
| 10% Raffinose solution | Teknova | R0500 |
| Critical commercial assays | ||
| Mix and Go! E.coli transformation kit and buffer set | ZymoResearch | T3002 |
| Frozen-EZ Yeast Transformation II kit | ZymoResearch | T2001 |
| QIAprep Spin Miniprep Kit | Qiagen | 27104 |
| DNA Clean & Concentrator-25 Kit | ZymoResearch | D4034 |
| Mycoplasma Detection kit | SouthernBiotech | 13100-01 |
| PureYield Plasmid Maxiprep System | Promega | A2393 |
| Deposited data | ||
| Fold induction data for Figures | This paper, Data S1 | https://data.mendeley.com/datasets/5pwykdf8fr/1 |
| Experimental models: Cell lines | ||
| HEK293T | ATCC | CRL-3216 |
| Experimental models: Organisms/strains | ||
| Saccharomyces cerevisiae BY4741 | ATCC | 201388 |
| Oligonucleotides | ||
| Synthetic DNA sequences for cloning, see Tables S1, S2-S5 | IDT | N/A |
| REAGENT or RESOURCE | SOURCE | IDENTIFIER |
| Recombinant DNA | ||
| pYTK001 | Addgene | 65108 |
| pYTK030 | Addgene | 65137 |
| pYTK056 | Addgene | 65163 |
| pYTK075 | Addgene | 65182 |
| pYTK076 | Addgene | 65183 |
| pYTK082 | Addgene | 65189 |
| pYTK087 | Addgene | 65194 |
| pYTK088 | Addgene | 65195 |
| pYTK093 | Addgene | 65200 |
| pYTK094 | Addgene | 65201 |
| Software and algorithms | ||
| GraphPad Prism v10.2.3 | Graphpad | https://www.graphpad.com/ |
| FlowJo v10.8.0 | FlowJo LLC | https://www.flowjo.com/ |
| SA3800 Spectral analyzer software | Sony | N/A |
| Other | ||
| Sterile 96 deep well plate | Greiner | |
| Tissue culture treated T25 flask | Cell treat | 651261 22931 |
| Tissue culture treated 24-well plate | Cell treat | 229124 |
| SA3800 Spectral Analyzer | Sony | N/A |
| SH300 Sorter | Sony | N/A |
5. 实验设置
5.1. 数据集
本研究主要利用两种真核生物细胞作为实验模型,并使用了多种构建体和报告基因系统。
- 酵母菌株 (Yeast strain):
Saccharomyces cerevisiae BY4741作为定向进化和初步表征的宿主。- 特点: 易于遗传操作、生长迅速,是经典的真核模式生物。
- 构建体:
- 融合酶表达盒: 编码
NPT7融合酶(NP868R-T7 RNAP 融合,带 Glycine-serine 接头和 NLS),受半乳糖响应启动子 (Gal promoter) 控制,整合到HO基因座。 - 报告基因质粒: 包含
ZsGreen、BFP或mScarlet-l荧光蛋白基因,受 T7 RNAP 启动子控制,并带有聚腺苷酸化信号 (polyadenylation signal) 和 T7 终止子,位于多拷贝酵母质粒上。
- 融合酶表达盒: 编码
- 哺乳动物细胞系 (Mammalian cell line):
HEK293T细胞作为在哺乳动物系统中验证进化酶性能的宿主。- 特点: 易于培养和转染,广泛用于基因表达研究。
- 构建体: 编码进化型
NPT7变体(不带 NLS),受CAG promoter和 β-球蛋白聚腺苷酸化信号 (beta-globulin polyadenylation signal) 控制。报告基因同样为荧光蛋白,但使用了不同的 5' 和 3' 非翻译区 (UTR) 序列。
数据集中的具体样本示例:
原文没有提供数据集中的具体序列样本或图像,但其荧光报告基因 ZsGreen、BFP 和 mScarlet-l 是常见的荧光蛋白,其表达量通过荧光强度来衡量。
5.2. 评估指标
本研究主要通过荧光报告蛋白的表达水平来评估 NPT7 融合酶的活性和性能。
5.2.1. 蛋白质表达水平 (Protein Expression Level)
- 概念定义: 指细胞中特定蛋白质的生产量,通常通过荧光强度来间接衡量。在本研究中,高荧光强度直接对应于高水平的功能性 mRNA 合成和随后的蛋白质翻译。
- 数学公式: 荧光强度通常由仪器直接测量,没有统一的公式,通常表示为任意单位 (Arbitrary Units) 或平均荧光强度 (Mean Fluorescence Intensity, MFI)。
- 符号解释:
- : 荧光强度,代表蛋白质表达水平。
AU: 任意单位。MFI: 平均荧光强度。
5.2.2. 折叠诱导 (Fold Induction)
- 概念定义: 折叠诱导是一个比率,用于量化在特定条件(如诱导剂存在下、或与野生型相比)下,基因表达或酶活性的倍数增加。它直观地表示了实验处理或工程改造带来的效果强度。
- 数学公式:
- 符号解释:
- : 折叠诱导倍数。
- : 处理组(如诱导后、或进化变体)的蛋白质表达水平(荧光强度)。
- : 对照组(如未诱导、或野生型)的蛋白质表达水平(荧光强度)。
5.3. 对比基线
本研究将自己的方法与以下基线模型或条件进行了比较:
- 野生型 (WT) NPT7 融合酶: 作为主要基线,用于评估定向进化后的活性提升。
- 加帽失活 (capping-null) NPT7 变体: 包含
K294A点突变的NPT7,用于验证观察到的活性是否依赖于加帽功能。 - 酵母内源性 (endogenous)
Gal promoter: 作为评估进化型NPT7驱动表达水平的参考,比较其与宿主转录机制的强度。 - 无 NLS (Nuclear Localization Signal) 标签的 NPT7 变体: 用于验证酶的活性是否确实在细胞核中发生。
6. 实验结果与分析
6.1. 核心结果分析
6.1.1. NPT7 融合酶在酵母中的初始活性及加帽重要性
研究首先在酿酒酵母中测试了野生型 NPT7 融合酶(NP868R 与 T7 RNAP 的融合,带有 NLS)的活性。
-
低活性: 在半乳糖诱导下,与未诱导对照相比,报告蛋白 ZsGreen 的表达仅增加了约2倍。这表明野生型融合酶在酵母中的初始活性相对较低,但已具有一定功能。
-
加帽功能关键性: 通过引入
NP868R结构域中的K294A点突变(导致加帽失活),结果显示报告基因表达水平显著降低。这明确证实了NPT7融合酶的加帽活性对于在酵母中实现高效蛋白质表达是至关重要的。下图(原文 Figure 1)展示了
NPT7融合酶的构建、定向进化流程以及在酵母中的初步表征。
该图像是图表,展示了在酿酒酵母中对NPT7变体的定向进化和特征化。图中包括不同变体(如v433和v443)在诱导下的表达活性,数据以平均值ext{±}标准差表示,反映了对合成生物学应用的可调控控制。
VLM 描述: 该图像是图表,展示了在酿酒酵母中对NPT7变体的定向进化和特征化。图中包括不同变体(如v433和v443)在诱导下的表达活性,数据以平均值ext{±}标准差表示,反映了对合成生物学应用的可调控控制。
原始论文描述: Figure 1. Directed evolution and characterization of NPT7 variants in Saccharomyces cerevisiae
6.1.2. 定向进化显著增强 NPT7 活性
通过在酵母中进行多轮易错 PCR 和 FACS 筛选,研究成功分离出两个高活性 NPT7 变体: 和 。
- 活性提升幅度: 这两个进化变体相对于野生型
NPT7的荧光信号增加了近两个数量级。这一结果表明定向进化是提高融合酶活性的有效策略。 - 突变分析: 基因型分析显示, 包含15个氨基酸突变, 包含10个氨基酸突变,且在5个残基位置观察到趋同突变,这可能指向对活性至关重要的区域。
- 加帽功能维持: 对进化变体的加帽失活版本进行测试,结果再次证实了加帽功能对高活性的重要性。即使是进化变体的加帽失活版本,其活性也比野生型失活版本高10倍,暗示了细胞核内可能存在的低水平背景加帽活性。
- 核定位的重要性: 去除
NPT7的 NLS 标签后,报告基因的表达水平显著降低,这表明融合酶的活性确实发生在细胞核中。
6.1.3. 可调控的基因表达控制
研究展示了进化型 NPT7 变体能够实现可预测和可调控的基因表达。
- 融合酶表达水平调控: 通过改变半乳糖的浓度,可以实现融合酶表达水平的梯度变化,进而精确调控下游报告基因的表达水平。这表明最终的表达可以通过调节融合酶的量来实现。
- 与内源性启动子强度相当: 驱动的报告基因表达水平与酵母内源性强启动子
Gal promoter驱动的表达水平相当,尤其是在多拷贝质粒背景下,这凸显了NPT7系统的强大表达能力。 - 多用途聚腺苷酸化信号: 将 SV40 pA 信号替换为三种不同的酵母内源性聚腺苷酸化信号(
tSsa1,tAdh1,tTdh1),发现报告基因表达水平相似,表明这些序列可以互换使用,简化了回路设计。
6.1.4. T7 启动子变体的可预测控制
研究使用了多种已知具有不同强度的 T7 启动子变体,并将其与进化型 NPT7 (v433 和 v443) 结合使用。
-
货物无关性: 将 ZsGreen 替换为其他荧光蛋白 (BFP 和 mScarlet-l) 后,观察到表达水平略有变化,但总体高表达水平保持不变,表明融合酶的增强活性不依赖于特定的货物基因。
-
启动子强度等级保持: T7 启动子变体的强度等级顺序(提供衰减转录活性的级别)在所有回路设计中都得到了保持。这表明该系统能够提供对基因表达的可预测控制,并且正交于宿主机制。
下图(原文 Figure 2)展示了 NPT7 变体在突变 T7 RNAP 启动子控制下的可调控基因表达。
该图像是示意图,展示了不同基因在酵母和哺乳动物细胞中的折叠诱导。图A展示了转录调控机制,图B和D显示了v443和v433的基因表达折叠诱导的量化数据,而图F则比较了不同基因在BFP表达下的相对表达水平。
VLM 描述: 该图像是示意图,展示了不同基因在酵母和哺乳动物细胞中的折叠诱导。图A展示了转录调控机制,图B和D显示了v443和v433的基因表达折叠诱导的量化数据,而图F则比较了不同基因在BFP表达下的相对表达水平。
6.1.5. 多路复用和正交基因表达回路
为了证明同时控制多个目标基因的能力,研究设计了一个包含三个独立荧光蛋白(ZsGreen、mScarlet-I 和 BFP)的基因回路。
-
独立控制:
ZsGreen的表达受不同强度的 T7 启动子变体控制,而mScarlet-I和BFP则受野生型 T7 启动子控制。结果显示,只有ZsGreen的表达水平随其启动子强度的变化而变化,而mScarlet-I和BFP的表达保持不变。这证明了在单一主调控酶下,可以独立控制多个基因的表达,且正交于宿主转录调控。 -
正交 NPT7 变体: 基于先前工程化的 T7 RNAP 变体(能够识别不同的突变 T7 启动子),研究构建了五个 的正交变体。每个变体都成功地切换了启动子特异性并生成了有帽转录本。尽管蛋白质生产水平低于野生型
NPT7,但这项工作验证了将正交 T7 RNAP 工具移植到真核生物中的可行性。下图(原文 Figure 3)展示了互相正交的 NPT7 变体的表征。
该图像是图表,展示了互相正交的NPT7变体的表征。在图A中,显示了不同的表达载体及其对应的荧光蛋白ZsGreen的表达模式。图B展示了各变体的折叠诱导度,表格中包含多种变体的折叠诱导量,显示不同表达系统的有效性。
VLM 描述: 该图像是图表,展示了互相正交的NPT7变体的表征。在图A中,显示了不同的表达载体及其对应的荧光蛋白ZsGreen的表达模式。图B展示了各变体的折叠诱导度,表格中包含多种变体的折叠诱导量,显示不同表达系统的有效性。
6.1.6. 进化型 NPT7 变体在哺乳动物细胞中的增强性能
为了评估跨真核宿主系统的通用性,研究在 HEK293T 细胞中测试了进化型 NPT7 变体 (v433 和 v443) 的细胞质活性。
-
跨界增强: 这些在酵母中进化的变体,在 HEK293T 细胞中表现出比野生型
NPT7高3到4倍的报告基因表达。这一结果令人鼓舞,表明本研究的定向进化方法能够产生在不同真核系统中都表现出增强性能的变体。 -
UTR 兼容性: 在使用包含不同 5' 和 3' UTR 序列的报告基因载体时,增强效果依然存在,进一步证实了其广泛适用性。
下图(原文 Figure 4)展示了在 HEK293T 细胞中对进化型 NPT7 变体的表征。
该图像是图表,展示了在HEK293T细胞中对进化型NPT7变体的表征。图中包括两个荧光蛋白ZsGreen和mScarlet-I的表达结果,以及不同的5'和3' UTR序列对其表达的影响。通过生物重复实验,结果以均值±标准差(SD)呈现,归纳了不同变体在荧光强度上的表现。
VLM 描述: 该图像是图表,展示了在HEK293T细胞中对进化型NPT7变体的表征。图中包括两个荧光蛋白ZsGreen和mScarlet-I的表达结果,以及不同的5'和3' UTR序列对其表达的影响。通过生物重复实验,结果以均值±标准差(SD)呈现,归纳了不同变体在荧光强度上的表现。
6.2. 数据呈现 (表格)
原文的主体内容中没有提供实验结果的表格。文中提及了“Fold induction data for Figures 1, 2, 3, and 4 have been deposited in Mendeley”,并且在“KEY RESOURCES TABLE”中提到了“Synthetic DNA sequences for cloning, see Tables S1, S2-S5”,这表明详细的数据表格和序列信息可能作为补充材料提供。本分析仅基于原文提供的文本和图像信息进行。
6.3. 消融实验/参数分析
本研究通过以下方式进行了类似于消融实验的分析:
- 加帽酶功能消融: 通过引入
NP868R结构域中的K294A点突变,使加帽酶失活。结果显示,无论是野生型还是进化变体,加帽失活都会导致报告基因表达水平显著下降,证明了加帽功能是该系统活性的关键。 - 核定位信号 (NLS) 消融: 删除了
NPT7融合酶的 NLS 标签,以评估其在细胞核中的活性。结果显示,无 NLS 的酶活性显著降低,证实了融合酶在酵母细胞核中的功能。 - 诱导剂浓度参数分析: 通过改变半乳糖浓度来调控
NPT7融合酶的表达水平,进而实现了对下游报告基因表达的梯度控制。这是一种参数分析,展示了系统表达的可调控性。 - T7 启动子强度参数分析: 使用不同强度的 T7 启动子变体来驱动报告基因表达,验证了这些启动子在真核系统中的可预测性和其强度等级的保守性。这同样是参数分析,展示了系统在不同输入条件下的响应。
7. 总结与思考
7.1. 结论总结
本研究通过一项精巧的定向进化工作,成功地将噬菌体 T7 RNA 聚合酶 (T7 RNAP) 与非洲猪瘟病毒加帽酶 NP868R 融合,创建了一个高效且正交的转录引擎,用于真核生物中的可编程基因表达。主要结论包括:
- 活性大幅提升: 通过酵母中的定向进化,获得了
NPT7融合酶的活性变体(如 和 ),其蛋白质表达水平比野生型融合酶高出近两个数量级。 - 正交性和可调控性: 进化型
NPT7变体在酵母中实现了可预测和可调控的基因表达,通过调控融合酶表达水平和使用不同强度的 T7 启动子,可以精确控制目标基因的表达。 - 多路复用和正交电路: 成功构建并演示了复杂的多路复用和正交基因表达回路,在单一主调控酶控制下实现多个基因的独立调控。
- 跨界通用性: 尽管在酵母中进化,这些工程变体在哺乳动物 HEK293T 细胞中也表现出增强的活性,显示了其在不同真核宿主中的广泛适用性。
- 合成生物学的重要进展: 该“加帽-T7”系统代表了合成生物学领域的一个重大进步,为在各种真核生物中构建稳健、独立于宿主因素的基因回路提供了强大且可扩展的新工具。
7.2. 局限性与未来工作
原文作者指出了本研究的以下局限性,并展望了未来的研究方向:
- 哺乳动物细胞中的提升幅度有限: 尽管在 HEK293T 细胞中活性有所提升(3-4倍),但这远低于在酵母中观察到的两个数量级的提升。这表明在酵母中进化的变体可能未完全针对哺乳动物系统进行优化,可能受到宿主特异性因素(如核输入机制、翻译后修饰或与内源蛋白的相互作用)的影响。未来的工作需要针对哺乳动物细胞环境进行进一步优化。
- 通用性仍需验证: 进化型
NPT7变体在其他真核生物(如非模式酵母、植物细胞或原代哺乳动物细胞)中的性能和适应性尚未测试。其真正的普适性需要更广泛的实验验证。 - 突变贡献的机制不明确: 和 含有多个氨基酸替换。目前尚不清楚每个突变对融合酶整体功能的具体贡献。需要进行详细的结构-功能分析和突变研究,以理解活性增强的机制,并为其他宿主系统提供更通用的设计规则。
- 长期稳定性与表观遗传沉默: 本研究未探讨基因表达的长期稳定性。真核细胞可能随时间推移通过表观遗传机制 (epigenetic mechanisms) 沉默外源基因元件,这可能会降低正交转录系统的有效性。未来的研究需要考察基因表达的持久性以及任何可能导致回路行为改变的表观遗传修饰,从而指导缓解沉默和维持稳定基因表达的策略。
- 严格染色质条件下的功能: 尽管该系统在酵母中表现优异,但在严格的染色质条件下的基因组整合仍是挑战。未来的工作可以探索如何使这些变体在抑制性染色质条件下有效工作。
- 潜在的体内/体外应用: 作者设想
Capping-T7系统在多种应用中具有潜力,例如在细胞质中表达融合酶(利用 OrthoRep 等系统),或用于简化5'加帽 mRNA 的体外合成,这对于 RNA 疗法(如疫苗)至关重要。
7.3. 个人启发与批判
7.3.1. 个人启发
这篇论文为真核合成生物学领域带来了显著的启发:
- 定向进化的强大力量: 再次证明了定向进化作为改造生物分子功能的强大工具。即使是复杂的融合酶系统,通过迭代的突变和筛选,也能实现巨大的性能飞跃。这为解决其他生物工程难题提供了范例。
- 正交系统的潜能: 成功构建了一个在真核细胞中高度正交的转录系统,摆脱了对复杂宿主转录机制的依赖。这对于构建可预测、模块化的复杂基因回路至关重要,有助于克服真核系统固有的复杂性。
- 跨界工程的 가능性: 在酵母中进化的酶在哺乳动物细胞中也表现出增强活性,这表明在易于操作的模式生物中进行工程改造,可能获得在更复杂生物中也具有通用性的分子工具。这为跨物种生物工程提供了新的思路。
- 克服表观遗传沉默的希望:
Capping-T7系统通过与宿主转录机制解耦,有潜力抵抗真核生物中常见的表观遗传沉默。如果能进一步优化,这将是实现稳定、长期基因表达的关键,尤其是在基因治疗和细胞工厂等领域。 - mRNA 疫苗生产的简化: 该系统在体外合成
5'加帽 mRNA 方面的潜力尤其令人兴奋,有望简化 mRNA 疫苗和其他 RNA 疗法的生产流程,提高效率和降低成本。
7.3.2. 批判
尽管本研究取得了显著进展,但仍有一些潜在问题或可以改进的地方:
- 哺乳动物细胞优化的必要性: 在酵母中的巨大成功未能完全复制到哺乳动物细胞中(3-4倍的提升 vs. 100倍)。这提示可能存在未被充分理解的宿主特异性相互作用或限制。未来的研究应该针对哺乳动物细胞环境进行专门的定向进化,以获得更极致的性能。
- 突变机制的解释不足: 论文指出了两个高活性变体的突变位点,但并未深入探讨这些突变如何协同作用以及它们对酶结构和功能的影响机制。缺乏对单个突变贡献的消融分析或结构建模,使得这些突变在未来设计中的指导意义有限。
- 长期稳定性数据的缺失: 论文明确指出未研究长期稳定性,这是任何用于治疗或工业应用的基因表达系统都必须解决的关键问题。表观遗传沉默是真核生物中普遍存在的现象,缺乏这方面的数据,使得对该系统实际应用前景的评估不够全面。
- 细胞毒性或免疫原性评估: 对于在哺乳动物细胞中使用的外源病毒元件(如非洲猪瘟病毒加帽酶)和噬菌体 RNAP,其潜在的细胞毒性或免疫原性是一个重要的考量。论文中未提及这方面的评估,这对于将该技术推向临床或大规模应用至关重要。
- 启动子多样性的扩展: 尽管验证了 T7 启动子变体的可预测性,但进一步探索和工程化更广泛、更精细的 T7 启动子库,将进一步增强该系统的可编程性。
- 复杂回路的进一步验证: 论文展示了多路复用和正交表达的初步证据,但未深入展示在更复杂、多层级调控回路中的应用。在这些场景下,潜在的资源竞争或意外的相互作用可能浮现,需要进一步的验证。
相似论文推荐
基于向量语义检索推荐的相关论文。