Efficient, continuous mutagenesis in human cells using a pseudo-random DNA editor
TL;DR 精炼摘要
本研究提出了一种名为TRACE的革新方法,通过将胞嘧啶脱氨酶与T7 RNA聚合酶融合,实现了在多代细胞中对特定基因的连续靶向诱变。TRACE的应用成功识别了与MEK1抑制剂耐药性相关的功能性突变,显著提高了诱变效率。
摘要
Here we describe TRACE (T7 polymerase-driven continuous editing), a method that enables continuous, targeted mutagenesis in human cells using a cytidine deaminase fused to T7 RNA polymerase. TRACE induces high rates of mutagenesis over multiple cell generations in genes under the control of a T7 promoter integrated in the genome. We used TRACE in a MEK1 inhibitor-resistance screen, and identified functionally correlated mutations.
思维导图
论文精读
中文精读
1. 论文基本信息
1.1. 标题
高效、连续的伪随机 DNA 编辑器在人类细胞中诱导突变 (Efficient, continuous mutagenesis in human cells using a pseudo-random DNA editor)
1.2. 作者
Haiqi Chen, Sophia Liu, Samuel Padula, Daniel Lesman, Kettner Griswold, Allen Lin, Tongtong Zhao, Jamie L. Marshall, Fei Chen
1.3. 发表期刊/会议
《自然-生物技术》子刊 (Nature Biotechnology),该期刊在生物技术和生物工程领域具有极高的声誉和影响力。
1.4. 发表年份
2019年
1.5. 摘要
本研究描述了一种名为 TRACE (T7 polymerase-driven continuous editing,T7 聚合酶驱动的连续编辑) 的方法,该方法通过将胞嘧啶脱氨酶 (cytidine deaminase) 与 T7 RNA 聚合酶 (T7 RNA polymerase) 融合,实现在人类细胞中连续、靶向的诱变。TRACE 能够在整合到基因组中的 T7 启动子 (T7 promoter) 控制下的基因区域内,在多个细胞世代中诱导高频率的突变。研究人员利用 TRACE 进行了 MEK1 抑制剂耐药性筛选,并成功识别了功能相关的突变。
1.6. 原文链接
/files/papers/6923eab9a71e4bc5cc3e5628/paper.pdf (已正式发表)
2. 整体概括
2.1. 研究背景与动机
细胞动力学研究的挑战: 用于研究真核细胞动力学的方法,如定向进化 (directed evolution)、谱系追踪 (lineage tracing) 和分子记录 (molecular recording),都依赖于能够实现靶向、连续诱变 (targeted, continuous mutagenesis) 的工具。然而,现有的工具存在显著局限性:
- 非生理环境 (Non-physiological environments): 例如,噬菌体辅助连续进化 (phage-assisted continuous evolution) 往往在非天然环境中进行,这可能导致产生的突变更适合进化环境而非生理系统。
- 快速饱和 (Rapid saturation): 依赖于 Cas9 酶切后非同源末端连接 (non-homologous end joining, NHEJ) 的 DNA 多样化方法,在原间隔序列邻近基序 (protospacer adjacent motif, PAM) 被破坏后很快就会饱和,使得连续、自我循环的诱变无法实现。
- 狭窄的编辑窗口或高设计成本 (Narrow editing windows or high design cost): CRISPR-Cas9 系统,如 CRISPR-Rx 和 EvolvR,通常只能靶向 sgRNA 结合位点附近的狭窄基因组窗口。如果需要编辑更长的区域,则需要设计、合成并递送大量的 sgRNA 来覆盖目标区域,这会大大增加实验的复杂性和成本。
- 在人类细胞中效率不足 (Inefficiency in human cells): 尽管最近有研究将 T7 RNA 聚合酶-脱氨酶融合方法应用于大肠杆菌 (Escherischia coli) 的定向进化,并且展示了更长的编辑区域,但尚未有研究证明这种编辑器系统在诱导真核细胞(特别是人类细胞)中连续核苷酸多样化方面的效率。
本研究的切入点: 鉴于现有工具的局限性,特别是在人类细胞中缺乏高效、连续、靶向的诱变方法,本文旨在开发一种能够克服这些挑战的新工具。研究人员希望结合噬菌体 DNA 依赖性 RNA 聚合酶 (bacteriophage DNA-dependent RNAPs) 的 DNA 进程性 (DNA processivity) 和胞嘧啶脱氨酶的体细胞超突变 (somatic hypermutation) 能力,以实现在真核细胞中对目标基因进行持续的核苷酸多样化。
2.2. 核心贡献/主要发现
本文介绍了 TRACE 方法,其核心贡献和主要发现包括:
- 首次在人类细胞中实现连续、靶向诱变: TRACE 结合了 T7 RNA 聚合酶 (T7 RNAP) 的 DNA 进程性 (DNA processivity) 和胞嘧啶脱氨酶 (cytidine deaminase) 的体细胞超突变 (somatic hypermutation) 能力,首次证明了在真核细胞(尤其是人类细胞)中高效、连续诱导核苷酸多样化的可行性。
- 诱导高突变率和宽编辑窗口: TRACE 能够在整合到基因组的 T7 启动子下游诱导高频率的突变 (平均 C>T 和 G>A 突变率在一周内可达 至 ),且编辑窗口至少为
2,000碱基对 (bp),使其能够靶向长基因组区域。 - 突变率可调控性: 通过对 T7 RNA 聚合酶进行工程改造(例如 P266L、G645A 和 Q744R 突变),可以调整胞嘧啶脱氨酶与 DNA 相互作用的概率,从而实现 TRACE 编辑速率的精细调节。
- 持续的核苷酸多样化: TRACE 能够在多个细胞世代(例如 20 天,约 20 个细胞世代)内持续诱导核苷酸多样化,且突变率单调、持续增加。
- 低脱靶效应和不影响细胞健康: 在 6 天的实验中,TRACE 未提高基因组的整体突变率(检测限为 ),且在 20 天内未观察到对细胞健康的显著影响。
- 支持功能性筛选: 成功将 TRACE 应用于两个功能性筛选场景:
- BFP-GFP 荧光光谱转变: 通过诱导单个氨基酸突变 (H66Y),将蓝色荧光蛋白 (BFP) 转换为绿色荧光蛋白 (GFP)。
- MEK1 抑制剂耐药性筛选: 在 MEK1 抑制剂筛选中,成功识别了赋予耐药性的 E38K 和 V211D 突变,并发现它们之间存在功能协同作用。
- 谱系追踪潜力: 利用条形码慢病毒 TRACE 模板,证明了突变在同一分子谱系中随时间累积,预示了 TRACE 在谱系追踪方面的潜在应用。
3. 预备知识与相关工作
3.1. 基础概念
为了充分理解 TRACE 方法,需要掌握以下生物学和分子生物学的基础概念:
- 胞嘧啶脱氨酶 (Cytidine Deaminase): 这是一类能够催化胞嘧啶 (C) 脱氨基形成尿嘧啶 (U) 的酶。在 DNA 中,尿嘧啶通常被识别并切除,如果未及时修复,在 DNA 复制过程中,U 会与腺嘌呤 (A) 配对,最终导致 C:G 到 T:A 的转换突变。在 TRACE 中,常用的胞嘧啶脱氨酶包括大鼠载脂蛋白 B mRNA 编辑酶催化多肽 1 (rat APOBEC1) 和激活诱导性胞嘧啶脱氨酶 (activation-induced cytidine deaminase, AID) 的超活性突变体 (AID*Δ)。
- T7 RNA 聚合酶 (T7 RNA Polymerase, T7 RNAP): 来源于 T7 噬菌体的一种 DNA 依赖性 RNA 聚合酶。它具有高度特异性,只识别并转录其特有的 T7 启动子 (T7 promoter) 序列。与宿主细胞的 RNA 聚合酶系统相比,T7 RNAP 在哺乳动物细胞中可以作为一个正交 (orthogonal) 的基因表达系统,因为它不依赖于宿主细胞的辅助转录因子,从而避免了交叉干扰。其特点是高进程性 (processivity),即在 DNA 模板上能够长距离连续地合成 RNA。
- T7 启动子 (T7 Promoter): T7 RNA 聚合酶特异性识别并结合的 DNA 序列,位于其转录起始位点上游。在 TRACE 中,目标基因被置于 T7 启动子下游,以便 T7 RNAP-脱氨酶融合蛋白能够靶向该区域进行编辑。
- 体细胞超突变 (Somatic Hypermutation, SHM): 是一种在 B 淋巴细胞中发生的生理过程,通过诱导免疫球蛋白基因区域的突变,产生具有更高亲和力的抗体。AID 酶是该过程的关键介质。TRACE 利用脱氨酶的这一特性来诱导 DNA 突变。
- 尿嘧啶 DNA 糖基化酶抑制剂 (Uracil DNA Glycosylase Inhibitor, UGI): UGI 是一种蛋白质,能够抑制细胞内尿嘧啶 DNA 糖基化酶 (uracil DNA glycosylase, UDG) 的活性。UDG 负责识别并切除 DNA 中的尿嘧啶。在胞嘧啶脱氨酶将 C 转换为 U 后,如果 UDG 被抑制,U 在 DNA 中停留的时间会更长,从而增加了在 DNA 复制过程中发生 U:A 配对、最终导致 C:G 到 T:A 突变的概率,从而提高突变效率。
- 核定位信号 (Nuclear Localization Signal, NLS): 一段氨基酸序列,能够引导蛋白质进入细胞核。由于 DNA 位于细胞核内,T7 RNAP-脱氨酶融合蛋白需要 NLS 才能进入细胞核并发挥作用。
- 慢病毒 (Lentivirus): 一种常用的基因递送载体,能够将外源基因高效稳定地整合到宿主细胞的基因组中,从而实现基因的长期表达。在 TRACE 实验中,慢病毒被用于将 T7 启动子控制下的目标基因或 TRACE 编辑系统稳定整合到 HEK293T 或 A375 细胞的基因组中。
- 荧光激活细胞分选 (Fluorescence-Activated Cell Sorting, FACS): 一种流式细胞术技术,根据细胞的荧光信号对其进行高速分选。在 TRACE 的 BFP-GFP 转换实验中,FACS 可用于分选出表达绿色荧光蛋白 (GFP) 的细胞。
- 聚合酶链式反应 (Polymerase Chain Reaction, PCR): 一种分子生物学技术,用于在体外快速扩增特定 DNA 片段。在 TRACE 实验中,PCR 用于扩增靶向区域的 DNA 片段,以便进行后续的测序分析。
- 高通量测序 (High-Throughput Sequencing,例如 Illumina MiSeq/Nextseq): 也称为下一代测序 (Next-Generation Sequencing, NGS),能够同时对数百万到数十亿个 DNA 分子进行测序,从而快速获取大量的 DNA 序列信息。在 TRACE 中,高通量测序用于量化突变率、分析突变分布,并识别功能性突变。
- 独特分子标识符 (Unique Molecular Identifier, UMI): UMI 是在测序文库制备过程中添加到 DNA 分子上的短随机核苷酸序列。每个原始 DNA 分子带有一个独特的 UMI,这使得在数据分析时能够区分重复的 PCR 产物和独立的原始分子,从而纠正 PCR 扩增和测序过程中的错误,提高突变检测的准确性,尤其是在检测低频突变时。
- MEK1 (Mitogen-activated protein kinase kinase 1, MAP2K1): 丝裂原活化蛋白激酶激酶 1,是 MAPK/ERK 信号通路中的一个关键蛋白。该通路参与细胞生长、增殖、分化和存活等多种细胞过程。MEK1 突变可能导致通路过度激活,从而促进肿瘤发生发展。MEK1 抑制剂常用于癌症治疗。
- MAPK-ERK 信号通路 (MAPK-ERK Signaling Pathway): 细胞内重要的信号转导通路,负责将细胞外信号传递到细胞核,调控基因表达。
- 血清反应元件 (Serum Response Element, SRE) 报告基因检测 (SRE Reporter Assay): SRE 是一种常见的转录调节元件,能够响应血清和生长因子等刺激,激活下游基因的表达。通过将 SRE 连接到报告基因(如荧光素酶)上,可以监测 MAPK/ERK 等信号通路的活性。
3.2. 前人工作
文章引言部分回顾了多种现有诱变或进化工具的局限性,从而衬托出 TRACE 的创新性:
- 噬菌体辅助连续进化 (Phage-assisted continuous evolution, PACE): 这种方法允许生物分子在实验室环境中进行连续定向进化。然而,其主要局限在于进化发生在非天然环境中,这可能导致产生的突变更适应体外筛选条件,而非实际的生理系统。
- Cas9 介导的 DNA 多样化:
- 基于非同源末端连接 (NHEJ) 的方法: 这类工具利用 Cas9 酶切 DNA 后,细胞通过 NHEJ 机制进行修复时引入随机插入或删除,从而实现 DNA 多样化。但问题是,一旦原间隔序列邻近基序 (PAM) 序列被破坏,Cas9 无法再次结合并切割,导致诱变过程迅速饱和,无法实现连续的、自我循环的诱变。
- CRISPR-Rx 和 EvolvR: 这些是基于 CRISPR-Cas9 的系统,通过引导 Cas9 或其衍生物到特定基因组区域,结合脱氨酶或其他突变酶进行编辑。然而,它们通常只在 sgRNA 结合位点附近的狭窄基因组窗口内起作用。如果需要对大范围区域进行多样化,则需要设计、合成和递送大量的 sgRNA,这在实际操作中非常繁琐和昂贵。
- T7 RNA 聚合酶-脱氨酶融合方法在细菌中的应用: 文章提及,最近有研究将 T7 RNAP 与脱氨酶融合,用于大肠杆菌的定向进化,并展示了对较长编辑区域的诱变。这表明了 T7 RNAP 进程性与脱氨酶结合的潜力。
3.3. 差异化分析
TRACE 方法与上述现有工具相比,具有以下核心区别和创新点:
-
连续性与非饱和性: 与 Cas9-NHEJ 方法(因 PAM 破坏而饱和)不同,TRACE 利用 T7 RNAP 的连续转录和脱氨酶的持续编辑能力,实现了真正的连续诱变,突变能够随着细胞世代的增加而不断累积。
-
宽泛的编辑窗口: 现有 CRISPR-Cas9 系统编辑窗口狭窄,或需要大量 sgRNA 覆盖。TRACE 利用 T7 RNAP 的进程性,能够在 T7 启动子下游至少 的宽窗口内诱导突变,大大简化了对长基因区域多样化的操作。
-
生理环境下的高效性: 尽管 T7 RNAP-脱氨酶融合在细菌中已有应用,但 TRACE 首次证明了该系统在人类细胞这一生理环境下同样高效,填补了在真核细胞中实现连续诱变的空白。
-
突变类型专一性: TRACE 主要诱导 C>T 和 G>A 碱基转换突变,避免了其他 DNA 编辑器可能产生的插入和删除 (indels),这有助于维持基因的开放阅读框 (open reading frame) 完整性,降低脱靶效应的复杂性。
-
低脱靶效应: TRACE 通过 T7 RNAP 对 T7 启动子的特异性识别,将编辑活动限制在靶向区域。实验结果表明,其基因组范围内的脱靶突变率极低,与背景噪音相当,且不影响细胞健康。
-
可调控的编辑速率: 通过对 T7 RNAP 进行工程改造,TRACE 的编辑速率可以进行精细调节,这为不同实验需求提供了灵活性。
综上所述,TRACE 提供了一种在人类细胞中进行高效、连续、靶向、且具有可控编辑窗口和低脱靶效应的核苷酸多样化新平台,克服了现有技术在连续性和适用性上的诸多限制。
4. 方法论
4.1. 方法原理
TRACE (T7 polymerase-driven continuous editing) 的核心思想是结合 T7 RNA 聚合酶 (T7 RNAP) 的 DNA 进程性 (DNA processivity) 和胞嘧啶脱氨酶 (cytidine deaminase) 的体细胞超突变 (somatic hypermutation) 能力,以实现在人类细胞中对目标 DNA 序列进行持续、靶向的核苷酸多样化。
其直觉原理如下:
- T7 RNAP 的靶向和进程性: T7 RNAP 是一种高度特异性的聚合酶,它只识别并结合其特有的 T7 启动子序列,并在其下游启动转录。这提供了一种精确靶向基因组特定区域的机制。一旦结合并开始转录,T7 RNAP 能够沿着 DNA 模板高效地、持续地移动很长的距离(高进程性)。
- 胞嘧啶脱氨酶的诱变能力: 胞嘧啶脱氨酶能够将 DNA 中的胞嘧啶 (C) 碱基脱氨基,将其转化为尿嘧啶 (U)。在 DNA 复制过程中,U 会被错误地识别为胸腺嘧啶 (T),并与腺嘌呤 (A) 配对,从而导致 C:G 到 T:A 的碱基转换突变。
- 融合蛋白实现协同效应: 将 T7 RNAP 与胞嘧啶脱氨酶融合,并引入核定位信号 (NLS)。当这个融合蛋白进入细胞核后,T7 RNAP 部分会将融合蛋白招募到基因组中整合的 T7 启动子处。一旦 T7 RNAP 开始沿 T7 启动子下游的 DNA 模板进行“转录”或“移动”,其携带的胞嘧啶脱氨酶就能在这个过程中持续地接触并编辑 DNA 链上的胞嘧啶,从而在 T7 RNAP 的移动轨迹上引入大量的 C>T 突变。由于 DNA 双链的互补性,被编辑的 C 链上的 C>T 突变,在其互补链上表现为 G>A 突变。
- UGI 增强突变效率: 融合蛋白的 C 端通常还会连接尿嘧啶 DNA 糖基化酶抑制剂 (UGI)。UGI 能够抑制细胞内修复尿嘧啶的酶 (UDG)。这样,由脱氨酶产生的尿嘧啶在 DNA 中的停留时间延长,进一步提高了在 DNA 复制时发生 C:G 到 T:A 转换突变的几率。
- 连续性: 由于 T7 RNAP 可以持续地在 DNA 上移动,并且细胞会不断分裂复制,该系统理论上可以无限期地在目标区域引入新的突变,实现连续的核苷酸多样化。
4.2. 核心方法详解
TRACE 系统的实现依赖于一个双质粒系统,包括 pTarget 质粒(包含 T7 启动子控制下的目标基因)和 pEditor 质粒(包含 T7 RNAP-胞嘧啶脱氨酶融合基因)。
4.2.1. pTarget 和 pEditor 质粒的设计与构建
-
pTarget质粒:- 设计:包含一个增强型绿色荧光蛋白 (EGFP) 基因或 MEK1 cDNA,置于 T7 启动子 (T7 promoter) 的控制之下。为了将目标基因整合到基因组中,该片段也被亚克隆 (subcloned) 到慢病毒骨架 (
Lenti_CMV-T-IR) 中。 - 构建:T7 启动子-GFP 片段从
pcDNA3.1(+)-IRES-GFP扩增,并亚克隆到pUC19骨架。BFP 片段通过定点诱变 (site-directed mutagenesis) 从 GFP 序列生成,并插入到pLX-TRC313骨架。T7 启动子-MEK1 cDNA 作为基因片段订购。 - 负对照:也构建了一个不含 T7 启动子的
pTarget质粒作为负对照。
- 设计:包含一个增强型绿色荧光蛋白 (EGFP) 基因或 MEK1 cDNA,置于 T7 启动子 (T7 promoter) 的控制之下。为了将目标基因整合到基因组中,该片段也被亚克隆 (subcloned) 到慢病毒骨架 (
-
pEditor质粒:- 设计:包含 T7 RNAP-胞嘧啶脱氨酶融合基因,并带有核定位信号 (NLS)。研究人员测试了两种胞嘧啶脱氨酶变体:大鼠载脂蛋白 B mRNA 编辑酶催化多肽 1 (rat APOBEC1) 和激活诱导性胞嘧啶脱氨酶的超活性突变体 (AID*Δ)。还测试了在 T7 RNAP 3' 端融合尿嘧啶 DNA 糖基化酶抑制剂 (UGI) 的变体,以促进 C:G > T:A 突变。
- 构建:
pAPOBEC-T7和pAPOBEC-T7-UGI:在pCMV-BE3载体中,通过 Gibson 组装 (Gibson assembly) 将 Cas9 (D10A) 替换为 T7 RNAP。原始的 T7 启动子被删除以避免自我编辑。pAID-T7和pAID-T7-UGI:将pAPOBEC-T7和pAPOBEC-T7-UGI中的rat APOBEC1替换为从 扩增的 。- T7 RNAP 突变体:为了调控编辑速率,通过定点诱变使用
pAID-T7-UGI作为模板,克隆了pAID-T7G645A-UGI、pAID-T7P266L-UGI、pAID-T7P266LG645A-UGI和pAID-T7G645AQ744R-UGI等变体。 - 可诱导表达系统:将 AID-T7 片段亚克隆到
pHR-EF1Alpha-puro-T2A-Tet-on 3G-TRE3G-Ascl1中,生成pHR-EF1Alpha-puro-T2A-Tet-on 3G-TRE3G-AID-T7,以实现四环素 (tetracycline) 可诱导的编辑器表达。
- 所有质粒序列均通过 Sanger 测序 (Sanger sequencing) 验证。
4.2.2. 细胞培养与质粒转染
- 细胞系: 使用 HEK293T 细胞 (ATCC) 和 A375 细胞 (ATCC)。
- 培养条件: 在 DMEM 培养基中,补充 GlutaMAX、丙酮酸钠、10% FBS、青霉素和链霉素,在 、 湿润培养箱中培养。
- 质粒转染:
- 双质粒转染:将 的
pTarget和 的pEditor质粒与TransIT-X2试剂混合,在Opti-MEM中孵育后滴加到 HEK293T 细胞中。 - 单细胞克隆转染:对于已整合靶标的单细胞克隆,使用 的
pTarget质粒进行转染。
- 双质粒转染:将 的
4.2.3. 慢病毒生产与单细胞克隆生成
- 慢病毒生产: 将 HEK293T 细胞与转移质粒、
Lenti_PAX2(包装质粒) 和Lenti_VSVg(包膜质粒) 共转染。收集含有病毒颗粒的上清液,并通过 滤器过滤。 - 单细胞克隆生成:
- HEK293T 细胞用慢病毒转导,并加入聚凝胺 (polybrene) 促进感染。
- 转导两天后,通过嘌呤霉素 (puromycin) 或潮霉素 (hygromycin) 筛选成功整合的细胞。
- 筛选后的细胞通过荧光激活细胞分选 (FACS) 以单细胞形式分选到 96 孔板中,然后扩增形成克隆。
- 通过转导
pLX-TRC313-BFP和pHR-EF1Alpha-puro-T2A-Tet-on 3G-TRE3G-AID-T7病毒并进行双重筛选,生成了完全整合 TRACE 系统的 HEK293T 细胞系。 - 类似地,生成了 T7 启动子-MEK1 整合的 A375 细胞。
4.2.4. 突变累积的长期监测
-
连续诱变实验 (Fig. 2a):
- 为了实现质粒在 HEK293T 细胞中的复制,使用了含有 SV40 复制起点 (SV40 origin of replication) 的
pEditor变体pAID-T7-UGI(在 骨架中)。 - 编辑器序列的 3' 端还融合了 T2A-tdTomato 序列,用于监测转染效率和质粒 DNA 复制。
- 将整合靶标的单细胞克隆接种到 12 孔板中,并转染 的
pTarget质粒。 - 在指定时间点收集一半细胞用于 DNA 提取和测序,另一半细胞传代到新的培养板中。
- 在第 11 天进行第二次转染。
- 在第 1 天(诱变前)、第 5、10、15 和 20 天收集基因组 DNA (gDNA) 样品,并对 T7 启动子控制的靶标区域(约 )进行测序。
- 为了实现质粒在 HEK293T 细胞中的复制,使用了含有 SV40 复制起点 (SV40 origin of replication) 的
-
动态控制编辑实验 (Supplementary Fig. 6):
- 将四环素 (tetracycline) 可诱导的
pEditor变体pAID-T7和 T7 启动子控制的靶标稳定整合到 HEK293T 细胞基因组中。 - 在培养基中加入多西环素 (doxycycline, Dox, 一种四环素类似物,) 以激活 TRACE 系统。
- TRACE 整合的 HEK293T 细胞在有或无 Dox 的条件下批量培养 20 天。
- 在第 1 天、第 6、10、16 和 20 天收集 gDNA 样品,并对 T7 启动子控制的靶标区域(约 )进行测序。
- 通过台盼蓝 (trypan blue) 染色和
Cellometer Auto T4评估细胞活力 (cell viability)。
- 将四环素 (tetracycline) 可诱导的
4.2.5. 荧光显微镜与图像分析
- BFP-GFP 转换实验:
- 将 T7 启动子-BFP 整合的 HEK293T 细胞接种到 24 孔玻璃底板中,并转染
pEditor。 - 使用倒置 Nikon CSU-W1 Yokogawa 旋转盘共聚焦显微镜成像,使用 (GFP) 和 (BFP) 激光。
- 使用
NIS-Elements AR软件捕获图像,ImageJ进行处理,CellProfiler进行细胞分割和 BFP/GFP 阳性细胞计数。 - GFP 阳性细胞通过
Otsu方法进行阈值处理。
- 将 T7 启动子-BFP 整合的 HEK293T 细胞接种到 24 孔玻璃底板中,并转染
4.2.6. 靶向突变分析 (On-target Mutation Analysis)
-
质粒 DNA 测序:
- 从约 100 万细胞中提取质粒。
- 使用
Phusion U Hot Start PCR master mix对 T7 启动子下游约 的靶向区域进行 PCR 扩增。 - 使用
Ampure XP磁珠进行纯化和片段大小选择。 - 使用
Nextera XT Kit制备测序文库。 - 在
MiSeq(Illumina) 上进行配对末端测序 (paired-end reads)。
-
基因组 DNA 测序:
- 从约 100 万细胞中提取基因组 DNA。
- 使用
Phusion U Hot Start PCR master mix和基因特异性引物对靶向基因组区域进行 PCR 扩增。 - 纯化、文库制备和测序过程与质粒 DNA 测序类似。
-
突变率计算:
- 每个样品生成约 100 万条读长 (reads)。
- 使用
bcl2fastq2剪切 Illumina 测序接头。 - 过滤质量分数低于 25 的碱基。
- 使用
Bowtie 2将读长与参考序列对齐。 - 使用自定义
MATLAB脚本计算每个碱基的突变富集。 - 去除每个读长两端 15 个碱基,并过滤读长计数少于 100 的碱基。
- 计算每个位置观察到的转换 (transitions)、颠换 (transversions) 和插入缺失 (indels)。
- 突变率 (Mutation Rate) 计算公式:
其中,
Number of reads with mutations at base是在该特定碱基位置检测到与参考序列不同的碱基的测序读长数量;Total number of reads at base是覆盖该特定碱基位置的总测序读长数量。 pT7样品用于估计由样品制备和 Illumina 测序引入的测量噪音。
4.2.7. 脱靶突变分析 (Off-target Mutation Analysis)
-
方法概述: 为了检测 TRACE 是否在基因组的其他区域引入脱靶突变,研究人员开发了一种条形码、基于转座酶的靶向测序方法,并结合了独特分子标识符 (UMI) 来纠正测序错误。
-
实验步骤:
- Read 1 接头生成: 通过退火 (annealing) 正义链序列和互补的嵌合末端序列 (mosaic end sequence) 生成。
- Tn5 酶加载: 将加载有 Read 1 接头的
Tn5转座酶制备。 - DNA 标签化 (Tagmentation): 从与
pEditor变体孵育 6 天的 HEK293T 细胞中收集基因组 DNA,并用加载的Tn5酶进行标签化,将 DNA 打断成片段并同时在片段两端加上接头。 - PCR 扩增 (第一轮): 使用条形码通用正向引物 (barcoded universal forward primers) 和基因特异性反向引物 (gene-specific reverse primers) 扩增标签化的 DNA 片段。这些基因特异性引物针对多个管家基因 (housekeeping genes)(如
GAPDH、β-actin、α-tubulin)和一个非编码 RNA (Malat1)。 - PCR 扩增 (第二轮): 使用条形码通用反向引物和相同的条形码通用正向引物,进一步扩增第一轮 PCR 产物,以加上 Illumina P5 和 P7 接头。
- 测序: 在
Nextseq(Illumina) 上进行配对末端测序。
-
脱靶突变率计算:
- 每个样品接收 100 万条配对末端读长。
- 从 Read 1 的 5' 端剪切 26 个碱基(包含 UMI 和接头序列),从 Read 2 的 5' 端剪切 20 个碱基(包含基因特异性引物结合区域)。
- 使用
Bowtie2将剪切后的读长与hg19(人类基因组参考序列) 对齐。 - 去除映射到线粒体、Y 染色体和未映射区域的读长。
- 使用
mpileup(samtools) 检查具有高映射质量和 Q 分数的位点。 - 去除映射到着丝粒周围区域 (pericentromeric regions) 以及读长覆盖度少于 10 的位点。
- UMI 去重和错误校正: 提取每个读长的 UMI,用于校正测序错误。对于具有相同 UMI 且至少有两条匹配读长的序列,将其中最常见的碱基调用 (base call) 确定为该 UMI 在该位置的共识碱基 (consensus base)。
- 过滤 UMI 去重后碱基数量少于 5 的位点,以及去重后少于 80% 的 UMI 具有相同碱基调用的位点(这些被认为是 SNP)。
- 脱靶突变率 (Off-target Mutation Rate) 计算公式:
其中,
Number of UMI-deduplicated bases different from consensus是在特定位置,经过 UMI 去重后的碱基中,与该位置的共识碱基不同的数量;Total number of UMI-deduplicated bases measured是在该位置经过 UMI 去重后测量的总碱基数量。 - 使用 Dunnett's 检验 (Dunnett's test) 确定统计显著性。
4.2.8. 条形码 TRACE 靶标文库生成 (Barcoded TRACE Target Library Generation)
- 目的: 实现分子谱系追踪 (molecular lineage tracing)。
- 步骤:
- 条形码寡核苷酸制备: 将含有 20 个随机碱基 (20 Ns) 的条形码寡核苷酸进行退火和磷酸化。
- 双链合成: 使用
Klenow fragment进行第二链合成,产生双链条形码寡核苷酸。 - 整合到慢病毒骨架: 纯化后,通过 Gibson 组装将条形码寡核苷酸插入慢病毒骨架。
- 转化与质粒提取: 将 Gibson 组装产物转化到
Endura electrocompetent cells中,回收大量菌落后提取质粒。 - 慢病毒转导: 生产条形码慢病毒,并以低感染复数 (multiplicity of infection, MOI) 转导 HEK293T 细胞,确保每个细胞接收到不同的条形码靶标。
- 诱变与 gDNA 提取: 通过 TRACE 对细胞进行诱变,然后提取 gDNA。
- PCR 扩增: 使用
Phusion U Hot Start PCR master mix扩增覆盖 20 Ns 条形码、T7 启动子和 T7 启动子控制靶标的约 900 bp 区域。 - 接头连接与测序: 进行第二轮 PCR 连接 Illumina P5 和 P7 接头,凝胶纯化后在
MiSeq上进行配对末端测序。
4.2.9. MEK1 抑制剂耐药性筛选
- 细胞准备: 将 T7 启动子控制的 MEK1 cDNA 通过慢病毒整合到 A375 细胞的基因组中。
- 诱变: 通过转染
pEditor变体pcDNA3.1(+)-AIDT7G645AQ744R-UGI对细胞进行 3 天的诱变。转染空载体 (empty vectors) 的细胞作为未诱变对照。 - 药物筛选: 将每孔约 50 万个细胞置于 的 selumetinib 或 trametinib 两种 MEK1 抑制剂下进行筛选,持续 2 周。
- DNA 提取与测序: 筛选后收集存活细胞,提取基因组 DNA。使用
Phusion U Hot Start Master MixPCR 扩增含有突变的 MEK1 cDNA。纯化、文库制备和测序过程与前述类似。 - 突变识别:
- 计算选择前后 MEK1 序列每个碱基的突变率。
- 富集倍数 (Fold Enrichment) 计算公式:
其中,
Post-selection mutation rate of a base是药物筛选后特定碱基的突变率;Pre-selection mutation rate of a base是药物筛选前相同碱基的突变率。 - 识别突变率大于 1% 且富集倍数大于 5 的突变。
- 单分子 Sanger 测序: 从 trametinib 耐药细胞克隆的 gDNA 中 PCR 扩增 MEK1 分子,克隆到
pLX-TRC313质粒载体中,转化细菌,挑取单菌落进行小量制备,然后进行 Sanger 测序以分析单个 MEK1 分子的突变组合。
4.2.10. SRE 报告基因检测 (SRE Reporter Assay)
- 目的: 评估 MEK1 突变体对 MAPK-ERK 信号通路活性的影响。
- MEK1 突变体构建: 使用 Gibson 组装构建
pcDNA3.1(+)-MEK1 wild type、pcDNA3.1(+)-MEK1E38K、pcDNA3.1(+)-MEKiV211D和pcDNA3.1(+)-MEK1E38KV211D质粒。 - 实验步骤:
- 将 HEK293T 细胞接种到 96 孔板中。
- 转染 SRE 报告基因质粒和相应的 MEK1 突变体质粒。
- 用含有 FBS 和 trametinib 的培养基处理细胞。
- 洗涤后,用含有 FBS 和重组人表皮生长因子蛋白 (epidermal growth factor protein, EGF,最终浓度 ) 的培养基孵育 6 小时。
- 使用双荧光素酶 (Firefly-Renilla) 检测系统监测报告基因活性。
- 报告基因活性 (Reporter Activity) 计算公式:
其中,
Firefly luminescence intensity是由 SRE 报告基因驱动的萤火虫荧光素酶的信号;Renilla luminescence intensity是通常由一个组成型启动子驱动的内参海肾荧光素酶的信号,用于标准化转染效率和细胞数量。
5. 实验设置
5.1. 数据集
本研究主要使用了两种人类细胞系作为实验模型:
-
HEK293T 细胞: 一种人胚肾细胞系,易于培养和转染,广泛用于基因表达、病毒生产和各种细胞生物学研究。在 TRACE 方法的开发、优化和功能验证(如 BFP-GFP 转换、连续诱变、脱靶效应分析)中作为主要的实验平台。
-
A375 细胞: 一种人黑色素瘤细胞系,常用于癌症研究,特别是药物耐药性筛选。在 MEK1 抑制剂耐药性筛选中作为功能性应用模型。
此外,为了进行特定的实验,还在这些细胞系中整合了以下目标基因:
-
T7 启动子-EGFP 基因: 用于测试 TRACE 的基本诱变效率和编辑窗口。
-
T7 启动子-BFP 基因: 用于验证 TRACE 诱导功能性突变的能力(BFP 转换为 GFP)。
-
T7 启动子-MEK1 开放阅读框 (ORF) cDNA: 用于 MEK1 抑制剂耐药性筛选。
-
管家基因 (Housekeeping genes) 和非编码 RNA: 包括
GAPDH、β-actin、α-tubulin和Malat1,用于脱靶突变分析,评估 TRACE 对基因组其他区域的非特异性编辑。
5.2. 评估指标
本研究使用了多种评估指标来衡量 TRACE 的效率、特异性、连续性和功能性。
-
突变率 (Mutation Rate):
-
概念定义: 突变率衡量的是在特定 DNA 区域内,单个碱基发生特定类型突变(例如 C>T 或 G>A)的频率。在靶向突变分析中,它量化了 TRACE 在目标区域诱导突变的效率;在脱靶突变分析中,它量化了 TRACE 在非目标区域引入突变的非特异性。通常以每千碱基 (kb) 或每碱基对 (bp) 的突变数量来表示。
-
数学公式 (靶向突变):
-
符号解释:
- : 特定碱基位置的突变率。
Number of reads with mutations at base: 在该碱基位置,与参考序列不同的测序读长数量。Total number of reads at base: 覆盖该碱基位置的总测序读长数量。
-
数学公式 (脱靶突变,UMI 去重后):
-
符号解释:
- : 特定基因组位置的脱靶突变率。
Number of UMI-deduplicated bases different from consensus: 在特定位置,经过 UMI 去重后的碱基中,与该位置的共识碱基不同的数量。Total number of UMI-deduplicated bases measured: 在该位置经过 UMI 去重后测量的总碱基数量。
-
-
每次读长突变数量分布 (Distribution of Mutations per Read):
- 概念定义: 该指标反映了在单个连续测序读长中,观察到的突变数量的分布情况。它有助于理解 TRACE 诱导突变的密集程度和随机性,以及突变是否随着时间或细胞世代的增加而累积。
- 数学公式: 无直接的单一数学公式,通常通过直方图或概率密度函数来展示。
- 符号解释: 无特定符号,通常指代每个测序读长所包含的突变总数。
-
GFP 阳性细胞百分比 (Percentage of GFP-positive Cells):
- 概念定义: 在 BFP 转换为 GFP 的功能性实验中,该指标衡量的是群体中成功发生荧光蛋白转换的细胞比例。这直接反映了 TRACE 诱导特定功能性突变(如 BFP 到 GFP 的 H66Y 突变)的效率。
- 数学公式:
- 符号解释:
- : 检测到的表达绿色荧光蛋白的细胞数量。
- : 检测到的细胞总数。
-
富集倍数 (Fold Enrichment):
- 概念定义: 在 MEK1 抑制剂耐药性筛选中,富集倍数用于衡量特定突变在药物选择压力下相对于未选择前的丰度增加倍数。高富集倍数表明该突变可能赋予细胞对药物的耐药性。
- 数学公式:
- 符号解释:
- : 特定碱基的富集倍数。
Post-selection mutation rate of a base: 药物筛选后该碱基的突变率。Pre-selection mutation rate of a base: 药物筛选前该碱基的突变率。
-
SRE 报告基因活性 (SRE Reporter Activity):
- 概念定义: 用于评估 MAPK-ERK 信号通路活性。通过测量 SRE 驱动的荧光素酶报告基因的表达水平,可以间接反映 MEK1 突变体对该通路信号传导能力的影响。
- 数学公式:
- 符号解释:
Firefly luminescence intensity: SRE 报告基因驱动的萤火虫荧光素酶的信号强度。Renilla luminescence intensity: 作为内参的、通常由组成型启动子驱动的海肾荧光素酶的信号强度,用于校正细胞数量和转染效率差异。
-
细胞活力 (Cell Viability):
- 概念定义: 衡量细胞群中活细胞的比例。用于评估 TRACE 系统是否对细胞的生长和生存产生负面影响。
- 数学公式: 通常通过活细胞计数与总细胞计数的比值计算。
- 符号解释:
Number of live cells: 通过台盼蓝染色等方法计数出的活细胞数量。Total number of cells: 通过计数得出的细胞总数。
-
统计学检验:
- Dunnett's 检验 (Dunnett's test): 一种多重比较检验,用于比较多个处理组与一个对照组之间的均值差异。在脱靶效应分析中,用于比较 TRACE 实验组与对照组的基因组突变率是否存在统计学显著差异。
- 单向方差分析 (One-way ANOVA): 用于比较三个或更多组均值是否存在统计学显著差异。在分析突变数量随时间的变化时使用。
- 双侧 t 检验 (Two-sided t-test): 用于比较两个样本均值之间是否存在统计学显著差异。在比较不同 T7 RNAP 突变体的突变率时使用。
5.3. 对比基线
本研究主要通过与多种对照组进行比较来验证 TRACE 方法的有效性和特异性:
-
无 T7 RNAP 融合的胞嘧啶脱氨酶 (pAPOBEC 或 pAID): 作为关键对照,这些实验表明单独的胞嘧啶脱氨酶在没有 T7 RNAP 引导的情况下,其诱变率与背景(仅 T7 启动子,
pT7)相似,从而证明 T7 RNAP 融合对于实现靶向诱变至关重要。 -
仅含 T7 启动子的质粒 (
pT7): 用于评估由样品制备和 Illumina 测序引入的背景突变或测量噪音。任何高于此背景的突变率才被认为是 TRACE 系统诱导的。 -
未诱变细胞: 在 MEK1 抑制剂耐药性筛选中,与未经 TRACE 诱变的细胞进行比较,以识别由诱变产生的耐药性突变。
-
不同 T7 RNAP 突变体: 比较野生型 T7 RNAP 与其突变体 (如 P266L, G645A, Q744R) 的诱变效率,以展示 TRACE 编辑速率的可调控性。
-
未受诱导的 TRACE 系统: 在四环素可诱导的 TRACE 系统中,未添加多西环素的细胞作为对照,以证明编辑活动的动态控制。
虽然论文没有直接与传统的“基因组编辑工具”进行并列的基线比较,但在引言和讨论中,通过分析现有方法的局限性(如 Cas9-NHEJ 的饱和性、CRISPR-Rx/EvolvR 的狭窄窗口或高成本、PACE 的非生理环境等),间接将 TRACE 定位为一种能够克服这些挑战的创新方案。
6. 实验结果与分析
6.1. 核心结果分析
本研究通过一系列实验,详细验证了 TRACE 方法在人类细胞中实现连续、靶向诱变的效率、特异性、可调控性和功能性。
6.1.1. TRACE 融合蛋白的诱变活性
-
T7 RNAP 活性保持: 首先,研究人员证实了 T7 RNAP-脱氨酶融合蛋白在保持 T7 RNAP 转录活性方面是有效的 (Supplementary Fig. 1)。这确保了融合蛋白能够正常识别 T7 启动子并沿着 DNA 移动。
-
靶向区域突变率:
-
研究人员测试了不同胞嘧啶脱氨酶变体(APOBEC1, AID*Δ)及其与 UGI 融合后的诱变能力。
-
结果显示,在转染
pTarget和pEditor质粒 3 天后,最有效的变体pAID-T7-UGI表现出最高的突变率:平均 C>T 突变率为 ,平均 G>A 突变率为 (原文 Figure 1d)。 -
同时观察到 C>T 和 G>A 替换,表明没有明显的突变链偏倚。
-
AID 构建体 (
pAID-T7-UGI,pAID-T7) 的酶活性高于 APOBEC 构建体 (APOBEC 的 C>T 突变率为 ,G>A 突变率为 )。 -
重要的一点是,仅转染胞嘧啶脱氨酶(
pAPOBEC或pAID)的细胞,其 C>T 和 G>A 突变率与仅含 T7 启动子 (pT7) 的对照组相似 (Supplementary Fig. 2a),这强有力地证明了 T7 RNAP 融合对于引导脱氨酶到靶标区域的重要性。以下是原文 Figure 1 的图像,展示了 TRACE 方法的构建、测序读长示例及突变率分析。
图注:i. b, 构建体的示意图。c, 诱变后代表性的高通量测序读长。C>T(绿色)和 G>A(红色)突变被高亮显示。d, 平均 C>T 和 G>A 突变率(均值 ± 标准误,n=3 次独立实验)。NLS,核定位信号。6.1.2. 低脱靶效应
-
-
研究人员开发了一种条形码、基于转座酶的靶向测序方法,结合 UMI 纠正测序错误,将检测下限降至 突变/bp。
-
在诱变 6 天后,对照组 (
pT7和pAID-UGI) 以及实验组 (pAID-T7-UGI) 的基因组 C>T 和 G>A 替换率均在 级别。 -
对照组和实验组之间没有观察到统计学显著性差异 (Dunnett's test,
pAID-T7-UGIvspT7, C>T 的 P = 0.2125;G>A 的 P = 0.2790) (Supplementary Fig. 3b)。 -
这表明 TRACE 在其检测限内不显著提高全基因组的背景突变率,显示出良好的特异性。相比之下,TRACE 诱导的靶向(T7 启动子驱动的)C>T 和 G>A 突变率在 级别,比脱靶率高三个数量级。
6.1.3. 靶向编辑窗口与可调控性
- 编辑窗口: 在 T7 启动子下游约 的窗口内观察到突变率显著增加。例如,使用
pAID-T7-UGI时,下游 459 个 C 中有 112 个、406 个 G 中有 83 个碱基的突变率高于背景噪音;而上游 407 个 C 中只有 7 个、545 个 G 中只有 3 个碱基发生突变 (Figure 1e 和 Supplementary Fig. 4a)。这证明了 TRACE 能够精确地在 T7 启动子下游的特定长区域内进行靶向诱变。 - T7 启动子稳定性: T7 启动子序列中 -5 C 位的 C>T 突变率在
pAID-T7-UGI条件下略有升高,达到平均约 (Supplementary Fig. 4b)。尽管此突变已知会削弱 T7 RNAP 结合,但数据表明功能性 T7 启动子副本大部分保持完整,约每 200 个副本中 1 个在 6 天内可能失活。 - 编辑速率可调控性: 研究人员测试了 T7 RNAP 的三个突变 (P266L, G645A, Q744R),这些突变已知会影响聚合酶的延伸率 (elongation rate) 或进程性 (processivity)。
pAID-T7G645AQ744R-UGI的 G>A 突变率显著高于野生型 (双侧 t 检验, P = 0.0051)。pAID-T7P266L-UGI的突变率显著低于野生型 (双侧 t 检验, P = 0.0424) (Figure 1f)。- 这证明了通过工程改造 T7 RNAP,可以有效调节 TRACE 的编辑速率。
6.1.4. 连续诱变与谱系追踪潜力
-
突变连续累积:
- 在整合了 T7 启动子靶标的 HEK293T 克隆中,通过
pAID-T7-UGI进行诱变,20 天内观察到突变率显著、单调、持续增加 (Figure 2a 和 Supplementary Table 2)。 - 每次连续 Illumina 测序读长中的平均突变数量也随时间单调增加 (Figure 2b, P < 0.01, 单向方差分析),表明 TRACE 能够在 20 个细胞世代(约 1 天/世代)中持续诱导核苷酸多样化。
- 在整合了 T7 启动子靶标的 HEK293T 克隆中,通过
-
动态控制: 通过四环素可诱导的
pEditor表达,实现了 20 天内编辑活动的动态控制 (Supplementary Fig. 6a 和 Supplementary Table 3)。 -
细胞健康: 诱导 TRACE 表达的细胞与未诱导细胞在细胞活力方面无显著差异 (Supplementary Fig. 6b)。
-
谱系追踪: 使用条形码慢病毒 TRACE 模板,证明了突变在同一分子谱系内随时间累积 (Figure 2c 和 Supplementary Fig. 5)。共享独特慢病毒条形码的读长也共享私有克隆和分层亚克隆突变,这表明 TRACE 在未来可能应用于谱系追踪。
以下是原文 Figure 2 的图像,展示了 TRACE 的连续诱变能力、MEK1 抑制剂筛选结果及功能相关突变。
图注:a, 整合了 T7 启动子-靶标的细胞在 20 天内的 C>T 和 G>A 突变(均值 ± 标准误,n=3 次独立实验)。b, 上图:20 天内每次连续读长的突变数量分布。下图:各时间点每次连续读长的平均突变数(均值 ± 标准误,n=3 次独立实验)。g, E38K、V211D 和 E38KV211D 突变体的荧光素酶 SRE 报告基因活性(均值 ± 标准误,n=3 次独立实验)。6.1.5. 功能性诱变应用
-
BFP-GFP 荧光光谱转变:
- 将 T7 启动子控制下的 BFP 基因整合到 HEK293T 细胞基因组中,并转染
pEditor变体。 - BFP 的 H66Y 氨基酸替换会导致荧光光谱向 GFP 转变 (Supplementary Fig. 7a)。
- 3 天后,
pAID-T7和pAID-T7-UGI组中,显著比例的 BFP 序列被转换为 GFP (Supplementary Fig. 7b 和 7c),证实 TRACE 能够诱导具有功能后果的突变。
- 将 T7 启动子控制下的 BFP 基因整合到 HEK293T 细胞基因组中,并转染
-
MEK1 抑制剂耐药性筛选:
- 将 T7 启动子靶向的 MEK1 开放阅读框整合到 A375 细胞基因组,诱变 3 天后,用 MEK1 抑制剂 selumetinib 和 trametinib 进行筛选 (Figure 2d)。
- 通过高通量测序识别了存活细胞中的 MEK1 突变体 (Figure 2e, f 和 Supplementary Table 4)。
- 关键发现: 识别到两个突变 (E38K 和 V211D) 赋予对两种抑制剂的耐药性,提示可能涉及相似的耐药机制。
- 突变相关性: 通过对单个 MEK1 分子进行测序 (Supplementary Fig. 8),发现 152 个单 DNA 克隆中 57 个含有两个以上突变。
- 特别是,E38K 突变仅作为与 V211D 共同存在的双突变体被发现,而 V211D 可以单独存在,这表明在选择压力下可能存在逐步突变固定 (stepwise mutation fixation) 的现象。
- 与突变文库筛选方法不同,TRACE 结合长读长测序能够方便地识别相关突变。
- 功能协同作用: 进行荧光素酶血清反应元件 (SRE) 报告基因检测,以评估 E38K 和 V211D 突变(单独或组合)对 MAPK-ERK 信号通路活性的影响。
- MEK1(E38K V211D) 诱导的报告基因活性显著高于野生型 MEK1、MEK1(E38K) 或 MEK1(V211D) 单突变体 (Figure 2g 和 Supplementary Table 5)。
- 这表明 MEK1(E38K V211D) 突变体通过显著提高 MAPK-ERK 信号通路活性来抵抗 trametinib。
6.2. 数据呈现 (表格)
本论文的主要结果以图片 (Figure 1, Figure 2) 和补充图表 (Supplementary Figures and Tables) 的形式呈现。在论文主体内容中没有以表格形式直接展示的结果。所有定量数据均在图表或文字描述中给出。
6.3. 消融实验/参数分析
本研究通过以下方式进行了类似于消融实验和参数分析的探索:
-
胞嘧啶脱氨酶变体比较: 比较了
APOBEC1和 两种胞嘧啶脱氨酶,以及是否融合UGI对突变效率的影响 (Figure 1d)。结果表明 具有更高的活性,UGI进一步提高了 C>T 突变率,这属于对核心编辑酶组件的参数优化。 -
T7 RNAP 突变体调控编辑速率: 通过引入 T7 RNAP 的特定突变 (P266L, G645A, Q744R),研究人员证明了可以对 TRACE 的编辑速率进行上调或下调 (Figure 1f)。这相当于对 T7 RNAP 进程性这一关键参数进行了系统性分析,并成功实现了对诱变效率的“微调”。
-
T7 RNAP 融合的重要性: 通过比较“仅脱氨酶”组与“T7 RNAP-脱氨酶融合”组的突变率 (Supplementary Fig. 2a),验证了 T7 RNAP 在靶向和提升编辑效率方面的关键作用,这可以视为对 TRACE 核心机制的“消融”验证。
-
诱导式表达系统: 引入四环素诱导系统,证明了 TRACE 可以在外部信号控制下动态开启和关闭,这是一种对系统可控性的参数分析。
这些实验都旨在理解和优化 TRACE 系统的各个组成部分如何影响其性能,并展示了其灵活性和可定制性。
7. 总结与思考
7.1. 结论总结
本研究成功开发并验证了一种名为 TRACE (T7 polymerase-driven continuous editing) 的新型基因编辑工具。TRACE 通过将 T7 RNA 聚合酶的 DNA 进程性与胞嘧啶脱氨酶的诱变能力相结合,首次实现在人类细胞中对目标基因进行高效、连续、靶向的核苷酸多样化。该方法具有以下关键优势:
-
高效且连续: 能够在多个细胞世代(20 天内)持续诱导高频率的 C>T 和 G>A 突变,突变率可达 到 。
-
宽编辑窗口: 能够有效编辑 T7 启动子下游至少 的长基因区域。
-
编辑速率可调控: 通过工程改造 T7 RNA 聚合酶,可以精细调节突变速率。
-
高特异性和低脱靶效应: 在 6 天内,未观察到全基因组范围内显著升高的脱靶突变率(检测限 ),且对细胞健康无明显影响。
-
功能性应用: 成功应用于 BFP 到 GFP 的荧光蛋白转换以及 MEK1 抑制剂耐药性筛选,识别了功能相关的突变 E38K 和 V211D 及其协同作用。
-
谱系追踪潜力: 证明了突变在同一分子谱系中随时间累积的能力。
TRACE 为在哺乳动物系统中研究细胞动力学、定向进化和分子记录提供了一个强大、可工程化且通用的平台。
7.2. 局限性与未来工作
作者在论文中指出了 TRACE 系统的当前局限性并提出了未来的研究方向:
- T7 启动子插入的必要性: 当前 TRACE 系统需要将 T7 启动子序列插入到目标基因组区域上游,这可能需要额外的基因工程步骤。未来可能需要开发更简便的靶向或启动子整合方法。
- 长期脱靶效应的进一步测试: 尽管在 6 天的实验中,TRACE 未显示出显著的脱靶效应,但在动物模型中进行长期研究,以更全面地评估其脱靶风险仍然是必要的。
- 拓宽碱基编辑范围: 未来可以通过结合其他碱基编辑酶 (base-editing enzymes) 来扩展 TRACE 系统的碱基编辑谱,实现 C>G、A>G 等其他类型的突变,从而增加多样化类型。
- 正交聚合酶系统: 引入其他正交的噬菌体聚合酶系统(例如 SP6 RNA 聚合酶),有望实现在多个基因组位点进行差异化编辑,从而更灵活地操控多个基因。
- 作为长期细胞记录器: 鉴于 TRACE 的连续性、可工程化特性以及宽广的记录窗口,作者认为它非常适合用作长期细胞记录器,用于记录细胞状态、历史或谱系信息。
7.3. 个人启发与批判
个人启发: TRACE 方法的创新性在于巧妙地结合了 T7 RNA 聚合酶的精确靶向性和高进程性,以及胞嘧啶脱氨酶的诱变能力,从而实现了前所未有的在人类细胞中的连续诱变。这对于理解细胞适应性、药物耐药机制、基因功能进化以及开发新型基因治疗策略具有巨大潜力。特别是其在 MEK1 抑制剂耐药性筛选中发现 E38K 和 V211D 协同作用的例子,突显了连续诱变在识别复杂功能相关突变方面的独特优势。此外,其在谱系追踪方面的潜在应用也令人振奋,为未来研究细胞发育和分化提供了新的工具。TRNA 聚合酶作为一种工具酶,其可工程化调控编辑速率的能力也为精准基因编辑提供了更多可能性。
批判性思考:
-
T7 启动子整合的限制: 尽管作者承认了 T7 启动子插入的必要性,这仍然是其在通用性应用上的一个主要限制。在许多场景下,对基因组进行预先的启动子插入可能非常复杂,甚至不可行(例如在一些原代细胞或难以进行基因编辑的细胞类型中)。未来的改进可能需要开发一种无需预先整合 T7 启动子,或者可以以更高效率和更少扰动整合启动子的方法。
-
编辑偏好性: TRACE 主要诱导 C>T 和 G>A 突变。虽然这避免了插入缺失,保持了阅读框,但在某些需要其他类型碱基转换或更广泛多样性的应用中,其编辑谱仍有限。虽然作者提到了未来可以通过结合其他酶来扩展,但这将增加系统的复杂性。
-
脱靶效应的精度与检测: 尽管在 的检测限下未发现显著脱靶,但 仍可能意味着在整个基因组中存在数千个脱靶突变。对于某些应用(如基因治疗),即使是极低的脱靶率也可能带来不可接受的风险。随着测序技术和计算方法的进步,更灵敏的脱靶检测方法将是评估 TRACE 安全性的关键。同时,文中提到 "no statistical significance was observed between the control and experimental conditions" for off-target, which means the difference was below the statistical power of the test at the given sample size/variance. This doesn't necessarily mean zero off-target, but rather undetectable with current methods.
-
蛋白质表达和稳定性: T7 RNAP-脱氨酶融合蛋白在细胞内的表达水平、稳定性和潜在的毒性可能会影响其长期应用的效率和安全性。文中提到不影响细胞活力,但融合蛋白的长期积累或降解动态仍需进一步研究。
-
与体内系统的兼容性: 尽管在人类细胞中验证了其有效性,但将 TRACE 系统应用于活体动物模型中将面临更多挑战,包括递送效率、免疫原性以及在复杂组织环境中的特异性。
-
"伪随机"的定义: 论文标题中使用了 "pseudo-random"(伪随机),但方法学中并未详细阐述这种“伪随机”的特性是如何体现的。它是否意味着突变位点具有一定的偏好性(例如,脱氨酶对特定碱基上下文的偏好),而非完全随机?如果存在这种偏好,这可能影响其在某些定向进化应用中的效率。
总体而言,TRACE 代表了基因编辑领域的一个重要进展,为理解和操纵生物系统提供了强大的新工具。但像所有新兴技术一样,其广泛应用仍需进一步优化和严格验证。
相似论文推荐
基于向量语义检索推荐的相关论文。