微生物系统中重组蛋白的产生改变了生物化学。原本需要几天时间的动植物组织或大量生物液体来纯化少量给定蛋白质的日子已经一去不复返了。重组蛋白技术已经在实验室和工业生产中广泛应用。大肠杆菌是生产重组蛋白的常用生物之一,它作为细胞工厂的用途已广为人知,并且已成为受欢迎的表达平台之一。
大肠杆菌作为宿主生物的优势
1. 具有快速生长动力学。在葡萄糖氯化钠介质中,并在适当环境条件下,其倍增时间约为20分钟。这意味着接种了1/100稀释的起始发酵液的培养物可能在数小时内到达固定相。应该指出的,重组蛋白的表达可能给微生物带来新陈代谢的负担,从而大大缩短了生产时间。
2. 高细胞密度培养很容易实现。大肠杆菌的理论密度极限液体培养估计约为200 g干细胞/约1×1013个活细菌/ ml。但是,实际操作过程中远远达不到这个数字。在简单的实验室设置中(即使用LB培养基在37°C下分批培养大肠杆菌),上限可能小于1×10 10/ml,低于理论极限的0.1%。因此,为了获得重组蛋白,我们也需要一种高浓度细胞培养的方法以促进大肠杆菌的生长。作为一个重负荷机器的有机体,由于对其生理的深入研究,这些策略不断的出现。
3. 用外源DNA转化是快速和容易的。大肠杆菌的质粒转化速度很快,仅仅在5分钟内完成。
大肠杆菌表达蛋白的常见问题
从理论上讲,利用大肠杆菌表达重组蛋白所需的步骤相对简单。您可以提取感兴趣的基因,将其克隆到任何可用的表达载体中,再将其转化为选择的宿主,进行诱导,然后就可以进行蛋白质纯化和表征了。但是实际上,有很多细节问题需要注意。以下我们回顾了大肠杆菌表达系统实际运用过程中的常见问题。
1. 质粒的选择
目前常见的表达质粒是复制子、启动子、选择标记、多个克隆位点和融合蛋白/融合蛋白去除策略的多种组合的结果(图1)。 因此,可用表达载体的目录比较大,选择合适的表达载体时容易出错,需要根据个人需求仔细评估。
图1. 表达载体的解剖。该图描绘了常见表达载体中存在的主要特征。
2. 复制子
作为自主单位进行复制的遗传元件(例如质粒)包含复制子。它是由一个复制起点及其相关的顺式作用控制元件组成。选择合适的载体时要注意的一个重要参数是基因拷贝数。基因拷贝数的控制权位于复制子中。逻辑上可以认为,由于细胞中存在许多表达单位,因此高质粒剂量等于更多重组蛋白产量。然而,高质粒数量可能会增加代谢负担,从而降低细菌的生长速度并可能导致质粒不稳定。因此,用于蛋白质合成的健康生物数量会下降。所以说将高拷贝数的质粒用于蛋白表达决不意味着增加产量。
常用的载体,例如pET系列,具有pMB1来源(ColE1衍生,每个细胞有15-60个拷贝),而pMB1来源的突变形式存在于pUC系列中, pUC系列中的pMB1复制起点的一个突变的类型型(每个细胞有500-700个拷贝)。可以在pQE载体(Qiagen)中找到野生型ColE1来源(每个细胞有15-25个拷贝)。这意味着它们无法在同一细胞中一起繁殖,因为它们彼此竞争复制机制。另外,还可以使用Duet载体(Novagen),可通过克隆同一质粒中的两个基因来简化双重表达。Duet质粒具有两个多个克隆位点,每个克隆位点之间都有一个T7启动子,一个lac操纵子和一个核糖体结合位点。通过组合不同的相容性Duet载体,可以从四个表达质粒中产生多达八个重组蛋白。
3. 启动子
pET载体中存在的T7启动子系统在重组蛋白表达中比较受欢迎。这并不奇怪,因为在成功的情况下靶蛋白可以占总细胞蛋白的50%。在该系统中,目的基因被克隆在噬菌体T7 RNA聚合酶(T7 RNAP,图2)的启动子下游。这种高活性的聚合酶应该在另一个质粒中提供。或者常见的是,它在lac UV5启动子的转录控制下,以编码T7 RNAP的噬菌体(λDE3)的形式置于细菌基因组中。因此,该系统可由乳糖或其不可水解的类似物IPTG诱导。基础表达可以由lac IQ控制,也可以由T7溶菌酶共表达控制。
图2. T7 RNA聚合酶的蛋白结构。
4. 其他问题
大肠杆菌中的高通量蛋白质表达和纯化已开始改变多种研究领域中进行研究的方式。通常需要几周时间手动处理一种蛋白质的实验现在可以在短短一周处理对数百种蛋白质。但是,该技术仍然存在局限性,并且有可能进一步改进。
在获得靶基因方面,计算机设计是基于阵列的从头合成,可能会在将来广泛使用。从头合成相关的主要挑战是成本较高。但是,如果可以将基于阵列的基因合成商品化,则成本可以降低3-5个数量级。
目前,通过共表达相应的酶可以在大肠杆菌中实现某些翻译后修饰。然而,这种共表达总是影响大肠杆菌的生长速率,并且几种载体不能在单个菌株中实现共表达。一种解决方案是将编码翻译后修饰因子的基因整合到基因组中,以产生"真核样" 大肠杆菌。此外,根据先前的研究,调节或控制靶蛋白的转录水平对于表达膜蛋白至关重要。
最后,可以使用用于蛋白质表达和纯化的自动化平台。但是对于大多数实验室而言,自动化平台太昂贵了。蛋白质生产过程的局限性几乎不可能以简单,整体的方式解决,失败的案例很少报道。因此,建立一个包含菌株、载体、启动子以及成功与失败案例的可搜索蛋白质表达数据库将有利于科学界的发展。
参考文献:
Rosano GL.; et al. Recombinant protein expression in Escherichia coli: advances and challenges. Frontiers in Microbiology, 2014, 5.
Jia B.; et al. High-throughput recombinant protein expression in Escherichia coli: current status and future perspectives. Open Biology, 2016, 6(8):160196.