当前位置:首页 >> 生物学 >>

nature 一篇文献的翻译《生物催化工程的第三次浪潮》


生物催化工程的第三次浪潮
过去的十年里, 由于科技的进步,无论是实验室还是工业规模都已确定用具 实用性并且环保的生物催化来代替化学合成中的传统的金属催化和有机催化。 DNA 测序以及基因合成的关键进展是基于剪切生物催化剂通过蛋白质工程和设 计, 及将酶整合入新的生物合成途径的能力取得的巨大进步。 为了突出这些成就, 在此我们讨论了以酶催化作为关键步骤,将蛋白质-动力学生物催化剂应用于从 通用化学品到先进医药中间体的范围。 生物催化是对合成化学中微生物和酶的应用, 作为自然界的催化用于新的目 的:酶的应用还未涉及到[1-5]。通过几次技术研究创新的浪潮,目前生物催化 领域已达到其企业成熟水平。

图 1 酶发现的进程及用于确定所需催化剂的蛋白质工程策略 理性设计(b)基于蛋白结构(a)或是同源模建识别不同的突变位点,而随机突变(c)与 筛选或是选择结合是定向进化实验的基础。结合这些方法使构建更小型但更智能的数据库 (d)成为可能。现在通过富集培养(e)对酶进行传统筛选已被关键的主题数据库检索(f) 代替以指导新型酶或是他们具备的所需特性的确定。在其初期仍是酶的设计(g)的从头计 算(从头合成 de novo) 。内部结构指的是通过生物催化不同的浪潮可得到的进行化学物质。 (R)-苯乙醇腈(左)在 100 年前的植物提取物中已经获得; (1S,3S)-3-氨基环己醇(中) 由 Novartis 公司利用一种固定化酯酶制成;6-氯-2,4,6-3 脱氧-D-赤型六吡喃环(右)由 DSM 用一个设计的醛缩酶耐受高浓度乙醛并且获得高选择性的过程制的。

1

生物催化的第一次浪潮(图 1) ,始于一个多世纪以前,科学家认识到活细 胞的组成成分可以应用于有效地生物转化 (相对于几千年已经司空见惯的发酵过 程) 。例如,Rosenthaler 利用一种植物提取物从苯甲醛和氰化氢合成的(R)-苯 乙醇腈[6]; 发生在微生物细胞内的类固醇的羟化[7]也已知。较新的例子即洗衣 粉中蛋白酶的利用[8]。 葡萄糖异构酶将葡萄糖转化为更甜味的果糖[9],青霉素 G 酰基转移酶制备半合成抗体[10]。这些应用关键挑战在于生物催化剂稳定性的 限制及诸如此类的缺点主要通过酶的固定化来克服,这也有利于酶的重复利用。 生物催化的第二次浪潮,在 20 世纪 80 到 90 年代,最初的蛋白质动力学技 术, 代表性的即基于结构的技术,扩大了酶的底物范围以允许异常的合成中间产 物的合成。 这一变化将生物催化扩展到医药中间体和精细化学品的制备。实例包 括脂肪酶催化水解手性前体用于合成地尔硫卓(一种治疗血压药物) ,醇腈酶催 化合成醇类对映异构体应用于降胆固醇抑制素药物, 脂肪酶催化合成蜡酯类物质 例如肉豆蔻醇肉豆蔻酸酯或是十六烷基蓖麻醇酸酯用于化妆品工业, 以及腈类水 合酶催化水合丙烯腈形成丙烯酰胺用于高分子材料 (这类腈类水合酶已在紫红红 球菌全细胞中获得) 。除固定化之外,目前的挑战包括优化用于非天然底物的催 化剂。 现阶段, 生物催化的第三大浪潮开始于 20 世纪九十年代中后期 Pim Stemmer 和 Frances Arnold 的工作。他们首创了分子生物学方法,通过达尔文进化论体 外实验快速大量地修饰催化剂。尽管这一术语于 1972 年的全细胞实验中曾被用 过, 现在这一方法通常称为定向进化,这一技术的最初方法涉及到在一个蛋白质 中氨基酸的随机突变的迭代循环法,随后从酶稳定性提高,底物特异性以及对应 选择性的突变体形成的库中筛选法。讨论到此,今后的发展已经集中于提高定向 进化的效率以产生“更智能地”数据库。工业生物催化主要集中于水解酶,一些 酮还原酶(KREDs) ,以及辅因子再生和在有机溶剂中蛋白质的稳定性研究。在某 些情况下,优化代谢途径;例如,融合不同的自然界菌株的基因于一个新的宿主 细胞以产生 1,3-丙二醇(形成多聚体的单体) ,使得将甘油转变为更易被利用的 原料葡萄糖成为可能。 由于现在的生物催化浪潮取得的进展,将酶设计成引人瞩目的新功能,例如 接受之前的惰性基质 (孟鲁司特的 KRED 或是西他列汀的转氨酶) ,或是改变形成 产物的性质 (萜环化酶突变体可作用于不同的萜烯或是氨基酸代谢物使醇类作为 生物燃料) 。如今需要新型酶将生物量转换为第二或第三代生物燃料,材料和化 学品。第三大浪潮的主要发展是先进的酶工程(包括定向进化) ,基因合成,序 列分析, 生物信息工具和计算机模拟,并且酶改进的理论进展可能比原来预期的 要更显著。工程酶可以在含有 60uC 的有机溶剂的溶液中保持稳定,可以接受新 的底物以及催化新的非天然反应。目前这一工程可能需要几个月,这样大大扩展

2

潜在的应用。过去,设计酶化的过程受到酶的限制;目前,酶设计逐渐适应工艺 规范。 大约十年前, 《Nature》和《Science》的文献综述了第一次和第二次生物催 化浪潮, 提出了可能带来的第三次浪潮的提示。现今及时评估第三次浪潮的影响 及推测未来十年可能的带来什么进展(框 1) 。尽管生物催化涉及到代谢工程和 合成生物学,但这些综述重点是针对酶法和全细胞反应。
框 1 生物催化应用要求及实例 ? 传统的生物催化, 天然产物采用自然反应和途径转变成其他天然产物。 技术要求: 尽可能控制自然生物转化;实例:面包和奶酪制作,皮革加工,啤酒和酒发酵, 及天然抗生素生成。 ? 宽底物范围生物催化,化学中间体(非天然产物)通过自然反应和途径转变成其 他化学中间体。技术要求:特定酶的使用(没有干扰活性存在) ;概念要求:许 多酶具有宽的底物范围;实例:采用酯酶和羰基还原酶(乙醇脱氢酶)生产医药 中间体。 ? 多级生物催化, 天然产物通过非自然反应和途径转变成燃料, 材料和化工原料 (非 天然产物) 。技术要求:蛋白质工程主要用于稳定性,底物范围和催化反应类型 的改变; 概念要求: 酶可以催化非自然反应, 酶的新的组合产生新的途径; 实例: 用异戊二烯生物合成途径生成燃料分子,氨基酸生物合成燃料乙醇。

适应酶工程的制造工艺 为了最大限度降低成本, 化工业需要在希望的工艺条件下产生稳定的,选择 性的及高产的催化剂。 这样的加工的酶设计先要确定设计目标, 例如增加稳定性, 可选择性,底物范围,或是通常这些性质的结合。2000 年,第三大浪潮前,只 有很少的策略可以满足这些目标。酶的固定化可以增加蛋白的稳定性,但是稳定 性的增加幅度较温和而且往往不能满足大多数化学转化。 定向进化也有可能满足 这些目标,但仍然缓慢,因为它需要对大型数据库进行建立和筛选,而且这些数 据库中大部分突变体是活性降低甚至没有活性的。 大幅改进的例子很少与产业相 关。低速意味着进化的蛋白仅包含一些变化,因此,酶性质仅稍微得到改变。尽 管几百年来酶法工艺已经应用于工业, 但大部分设计的酶和全细胞从遗传学上已 被最低限度的改变了。
流程设计标准(一个 或一些或全部) 所需性质改变的定 量检测 ? ? ? ? ? ? ? ? ? 生产过程中的高活性 稳定性增加 热稳定性的最高温度增肌 对有机溶剂稳定 底物缺失和/或产物抑制 储存和运输热稳定性增加 选择性提高(对应选择性、位置选择性、化学选择性) 作用新底物 催化新反应
3

?

??

△G 蛋白质设计目标 对蛋白质力学和动 力学的理解 ? ? ? ? ? ? ? 未折叠酶不稳定 折叠酶稳定 增加底物结合 阻止多余底物 重塑底物结合位点 添加主要力学过程 ??

△G 蛋白质设计策略(氨 基酸变化) 结合计算机模型的 结构模型设计 ? ? ? ? ? 构建空间位阻 添加氢键和离子对 通过形成环降低或增加柔性(熵) 疏水相互作用 ??

蛋白质多样性策略 (氨基酸变化) 更可取的分子但并 非必须

? ? ?

通过随机突变,定点突变,定点饱和突变,转基因等得到突变体 接近反应条件的条件下进行检测 采用生物信息学工具如 ProSAR 优化确定提高适应性的突变体或是 氨基酸替换

核酸和基因组优化 (沉默突变,非编码 区变化)

? ? ? ? ? ? ? ?

提高目的基因转录效率(超表达,高保真) 增加 mRNA 稳定性 提高 mRNA 翻译效率 调整启动子长度 改进核糖体结合序列 增加适合有机体酶生成的密码子的使用 当需要合适的折叠时增加密码子使用以加速或降低翻译 敲除催化底物或产物副反应的酶的密码子或是讲解目的酶

图 2 通过蛋白质工程策略结合自由能(△G)设计目标所需的结构改变
这一推理需要利用更集中的数据库。 如果设计目标并非在于开始酶的作用, 那么大变化的自 由能是必要的。 对蛋白质伸展及反应机理的力学和动力学的理解确定达到设计目标的设计策
4

略。最终,结构分析(从定性的检测到大量的计算机模拟的差异)可以确定必须改变的区域 和氨基酸。需要高的自由能变化的目标将同样需要结构上更广泛的变化。

过去的十年里, 我们对蛋白质和有效地定向进化策略属相的理解都加深,可 能酶学性质发生巨大改变。 总的来说,酶工程仍将是通过运用各种解决目前问题 可能的方法,对研究成果进行收集,而不是例如用在那些土木,电器,软件或是 化学工程的学科的定量的方法。 这些实验研究转化为动力学原理将需要运用自由 能与设计目标产物结合成需要的结构变化(图 2) 。性质的巨大转变需要自由能 的较大转变。例如,稳定性的明显改变将需要折叠-伸展平衡时更多的自由能变 化。 (甚至蛋白质不可逆的伸展起始于一个可逆的部分伸展。 )对蛋白质分子生物 学的理解暗示着策略可得到改善。例如,表面残基促进折叠-伸展平衡,并且在 环区增加一个脯氨酸会降低伸展形式的熵。这些策略代替了随机突变(大部分具 有更差的性质) 巨大的数据库, 而是包含高比例具有活性且潜在的改进的突变体 组成的更小的,更集中的蛋白质数据库(图 1) 。最后,通过估算各种反应(表 面离子对或是增加脯氨酸对熵变的贡献)的强度,研究者可以估算出达到目标所 需的变化。 目前很少有研究人员明确的应用基于自由能的方法来计算蛋白质自由 能策略,但是将实验研究转变入动力学原理需要一种定量的方法。 新的改进的方法 过去的十年里,DNA 技术和生物信息学主要进展已经为生物催化领域提供了 关键性的支持。 这些工具已经促进了自然资源中新型酶的发现,并且大体上加速 了目前生物催化剂的重新设计。 先进的 DNA 技术 新一代的 DNA 测序技术已可以大规模且相当低成本地进行平行序列的分析。 然而, 2002 年人类基因组序列分析的成本估计为 70,000,000 美元,2012 年成本 已大大降低了 1,000 倍,低于 10,000 美元(参考 34) ,Life Technologies 公司, Illumina 公司和 Oxford Nanopore Technologies 公司已宣布能够在几个小时内对 人类全基因组完成测序的测序设备的设计经在 2012 年晚些推出,这将使每一个 基因组的成本降低至少于 1,000 美元。不同环境的有机体的全基因组序列,或是 环境中的不可培养的有机体(宏基因组)的 DNA 样本,都已建立了丰富的资源, 以供在其中搜索新型生物催化剂[35],而且会继续进行。运用 Illumina 技术进行 大规模的高通量测序 (10,000,000 序列读取) 也促进了对蛋白质序列-功能关系的 探索和了解[36]。 低成本 DNA 合成已代替基因组 DNA 的分离成为蛋白质工程的开端。全基 因 DNA 合成可以进一步为宿主生物体优化密码子, 将分子总体结构例如启动子, 终止子,增强子,限制性位点等引入到合适的位点。DNA 合成应用传统的亚磷 酰胺化学法, 但是优化的反应条件已经提高了配对效率,这样增加了聚合物整体 质量和数量使得序列可以甚至达到 200-250 个核苷酸长度。并行 DNA 合成应用
5

光刻和喷墨印刷技术进一步降低成本并实现快速合成[37]。 DNA 合成也已被用于 染色体 DNA 的整个部分甚至用于代谢途径工程的全基因组的合成[38]。全基因 合成也可被用于合成高质量 DNA 数据库,范围从小型,集中,饱和位点数据库 到大型, 综合性的基因库。 自定义的基因甚至基因库正成为类似如今研究实验室 使用的试剂和溶剂的商业化化学品。 生物信息学新型工具 对实验进展进行补充, 生物信息学工具已经成为现代蛋白质工程的一个主要 部分[39]。大的酶家族和同源性搜索的多序列比对中已经确定具有相似催化活性 的基因,导致新型的,强有力的生物催化剂[40]。相同的序列信息可以重建原始 的生物催化剂[40],它可能具有更广泛的底物范围和催化多功能性(见下文) 。 多序列比对确定每个位点最常见的氨基酸(共有序列)和氨基酸替换以得到功能 稳定的酶。 这一数据有助于具有高比例催化活性突变体的小型数据库的设计。这 些数据库已被用于稳定性、 催化功能增强及立体选择性改变的生物催化剂的发现 [41]。 结合基于序列的蛋白质工程的进展, 结构指导的方法已经从储存在 RCSB 蛋 白数据库(http://www.pdb.org)中蛋白质结构坐标快速增加中获益。过去的十年 里,资源库增加已超过 450%,包括超过 77,000 种蛋白结构。这既有利于合理蛋 白质的设计又促进定向进化,因为相关蛋白的结构比对有助于确定显著地异同, 指导突变体库更可靠的设计。 用两种不同的方法增加酯酶对分解一种手性合成子 2-甲基-3-溴丙酸的对应 选择性证明了较小型数据库的实效[42],采用随机突变从成千上万的突变体中筛 选出 200 个,酶的 E 值(使一种对应体转变成另一种的酶的选择性)从 12 增加 到 19(见 43) 。认识到得到一个实用性的(E.30)需要两个对映体间差异活化能 (△△△G+)一个相对较小的增加(0.5 kcal/mol) ,突变形成集中于活性位点。 一个包括在四个位点出现的所有可能的单点突变(76 个突变体)的数据库,可 以产生一个 E 值 561(△△△G+50.96)的酶。了解了需要解决的问题的关键主 要在于从较小型数据库中酶的优化方法以及提出更大的改进。关于此点,提出了 一种相当有价值的新方法进行持续定向进化, 它可用于噬菌体侵染系统与大肠杆 菌重组质粒的结合[44]。 工业生物催化中工程酶的实例 据 Schmid 等 2001 年前瞻性综述预测[29],过去的十年里已报道辅因子连续 再生和酶的宽范围。然而,生物芯片和组合生物催化的预测应用尚未实现。非代 谢细胞生物催化的使用已证明比预期要困难得多, 而且这一策略已转向用于未加 工和半纯化形式的工程酶。 鉴于史上一种全细胞可以提供一个简单高效选择的辅 因子再生以及酶稳定性增强,目前蛋白质工程和单酶的使用被认为更加经济实

6

用。单酶的使用还用其他的优势:更易去除(加入量更少,因为每单位质量具有 更高的活性) ,耐受更苛刻的条件,消除细胞膜造成的潜在的扩散限制,而且更 容易运输到细胞各处。例如,目前基于 KRED 的过程代替了全细胞还原反应和 基于金属配体的化学催化作用,过去的十年里这些曾是工业标准[45,46]。全细胞 过程是一个例外, 它可以将外消旋的海因转换成光学纯的,非天然存在的一种氨 基酸。发现重组大肠杆菌成为一个简单高效的生产系统,同时表达海因酶,氨甲 酰水解酶和消旋酶, 代替了在连续的固定床反应器中,以三种固定酶酶基础的原 始的加工方法[47,48]。此外,全细胞过程不需要代谢通量控制以及进行中没有非 预期的副反应。

图 3 阿托伐他汀(立普妥)关键侧链合成不同的酶催化途径 这些途径采用 KRED 与卤醇脱卤酶(HHDH)的结合(途径 1) ,腈水解酶(途径 2) ,或是 醛缩酶(途径 3) 。它们的区别不仅是酶的不同,也有(廉价)原材料的选择、生物催化剂 活性和选择性,下游加工,以及最终产物产量和纯度。途径 1,2 得到一个立体中心,然而途 径 3 可以同时得到后期医药中间体的两个立体中心[52]。紧接着途径 1,2 引进第二个手性中 心也是通过应用 KRED 完成的。LDA,二异丙基氨基锂;t-Bu,叔丁基;THF,四氢呋喃。

KREDs 和其他酶都已广泛用于研究药物手性中间体的制造,例如阿托伐他 汀是立普妥的有效成分, 是一种降胆固醇药物, 2010 年全球销量为 11,900,000,000 美元。七种酶促途径[2,49,50](图 3)已成熟,其不同不仅是酶和原材料的选择, 而且关于产物是否是一种物质(单一手性中心)或是晚期中间产物(两个手性中 心) 。在所有情况下,成功需要蛋白质工程来提高反应速率,对应选择性,高底
7

物浓度(高达 3M,例在腈水解酶过程中[51])的稳定性,或高溶剂浓度(KRED 催化过程中 20%乙酸丁酯[52]) 。除了高活性的生物催化剂,低成本过程也需要 廉价的原料和简单的单一高产率产物的分离。 通用的一种产生晚期中间产物的方 法采取 3 步生物催化:一,KRED 和葡萄糖脱氢酶的结合;二,与卤醇脱卤酶的 结合以>100tyr-1 生成 R(-)-4-氰基-3-羟基丁酸乙酯中间物(图 3) ;三,晚期二醇 中间产物的酶促还原反应[52]。 最近工程[17]扩大了转氨酶转化为带有两个大的取代基的酮类的底物范围。 酶工程从一个小的酮底物开始, 在活性位点产生更大的空间,并且利用越来越多 的酮类。几个循环的定向进化增加了它的活性~40,000 倍,并且获得一个改造的 氨基转移酶(图 4) ,其可以代替基于过度金属加氢催化西他列汀的生产。起始 于 ATA-117,一个与对底物未检测到活性的野生型酶高度同源的酶,第一次突变 体获得非常低的活性(0.2%转化率,2gl-1 底物,10gl-1 酶)转化为 prositagliptin; 最终的突变体将 200gl-1 的酮转化为西他列汀转化率为 92%,99.95%的旋光异构 体。 生物催化过程不仅降低了总体的浪费和排除了所有的过渡金属,而且相对于 金属催化过程增加了 53%的整体产量和生产率[18]。医药企业众多的生物催化路 线逐渐增加(表 1) ,显示了它们与传统化学反应的竞争力。

图 4 生物催化推进合成化学 采用设计的安吉转氨酶合成西他列汀的酶催化路线优于化学加氢反应,产生更高产量的 99.5%旋光异构体光学纯产物, 更高的产率, 降低了整体耗费和过渡金属催化的去除[17,18]。 Atm,大气压;e.e.,旋光异构体;Me,甲基

最优化研究得到的酶突变体是未来项目出发点一种独特的来源, 通过用更稳 定的酶设计一种方法, 下一步优化过程可以更快。 例如, 设计 KREDs 生产 R3HT (3) (见表 1 化合物缩写和编号) ,得到了许多稳定的酶突变体,包括一些由于 低的对应选择性不适合的酶突变体。然而,这些不合适的突变体是设计 KRED 用于 DCFPE(4)的启动酶。然后 DCFPE 酶是孟鲁司特(5)KRED 的起点,孟 鲁司特 KRED 转而又是度洛西汀(6)KRED 的起点。相似的,在 prositagliptin(18) 转氨酶进化期间产生的转氨酶, 可以生成另一个胺类,可能作为胺合成的新的工
8

表 1 医药行业最近成熟的生物催化过程(见原文) 表 2 十年里生物催化获得的总统绿色化学挑战奖 产品 琥珀酸作为化学原料 1,4 丁二醇为聚合物 和化学原料 高级醇类作为燃料和 化学原料 来自脂肪酸的代谢中 间产物的可再生石油 西他列汀:治疗 2 型 糖尿病的医药原料 用于化妆品及个人护 肤品的酯类 用于治疗高胆固醇症 阿托伐他汀中间体 用于生物降解塑料盒 化学原料的聚羟基脂 肪酸 人体营养凡是脂肪和 油脂 鼠李糖脂:基于生物 的生物降解工业表面 活性剂 治疗乳腺癌的紫杉醇 运用酶去除粘性污物 提高纸张的循环利用 利用酯酶的聚合酯合 成 1,3-丙二醇合成高分 子 乳酸合成聚(乳酸) 聚合物 制成纤维前去除棉花 中天然蜡状物和油脂 技术 发酵 发酵 发酵 发酵 酶 酶 酶 发酵 公司 BioAmber Genomatica UCLA (Prof. Dr J. Liao) LS9 Merck and Codexis Eastman Chemical Co Codexis Metabolix 年 2011 2011 2010 2010 2010 2009 2006 2005

酶 发酵

ADM and Novozymes Jeneil Biosurfactant Company Bristol Myers Squibb Buckman Laboratories International Polytechnic University (Prof. Dr R. Gross) Dupont NatureWorks Novozymes

2005 2004

发酵 酶

2004 2004



2003

发酵 发酵 酶

2003 2002 2001

9

程酶的起点。 从非天然存在的稳定的以在过程中起作用的酶突变体开始,从而以 前所未有的方式加速了催化剂及反应进程。 同时设置两个立体对映中心的酶的转化是生成复杂分子相当高效的方式。 例 如,KRED 催化酮类还原反应设置醇类立体对映中心。然而,如果紧挨着酮类羰 基第二个立体中心在溶液中迅速的发生外消旋反应, KRED 对一种构型具有高度 选择性,那么这个还原反应可以一步设置两个立体中心。包括青霉烯中间体(8) 伪麻黄碱(12)以及福林(13)的实例,还有手性胺(20)相似的反应。此外, 醛缩酶目前被用于随后的反应步骤以生成多个手性中心,例如,在他汀类中间体 (33)的合成。随着醛缩酶催化作用,单酶级联反应已进一步扩展到多酶级联反 应,例如在 2'-脱氧肌苷(34)体外合成或是像青蒿素(42)或紫杉醇的复杂分 子体内的合成。 生物催化进程的环境优势 在化工业环境方面担忧的背景下,生物催化提供了具有吸引力的选择。美国 环保局在每年的总统绿色化学挑战上奖颁发五个奖项。提名强调绿色化学的 12 项原则[53],考虑了环境因素以及再生原料的利用、能源效率和员工安全防护。 或是利用酶技术或是全细胞的生物催化自从 2001 年已获得 16 项奖(表 2) 。生 物催化剂来源于再生能源,是生物可降解的,无毒性的,并且其高选择性简化了 反应分离净化实验,高产生成产物。生物催化反应也是安全的,因为其一般在室 温,大气压和中性 pH 条件下进行。因此,生物催化获得许多奖项并不奇怪。 表 2 中奖项的广泛范围显示了生物催化剂在医药行业以外的应用。 有些应用 涉及到聚合物尤其是多元酯。乳酸的优化发酵是内布拉斯加州每年 141,000 公吨 生产力的聚乳酸厂的基础, 新的非天然存在的代谢途径可进行 1,3-丙二醇 Sorona 聚合物加工。1,4-丁二醇发酵生成另一种聚合物组分氨纶。聚羟基脂肪酸的合成 过程中,生物催化剂催化不只是单体的合成还有它的聚合物。Yang 与其同事最 近设计聚羟基脂肪酸合成酶使乳酸聚合成聚乳酸[54]。其他一些奖项涉及到加工 生物燃料的新的代谢途径。例如,LS9 公司设计的大肠杆菌生产生物柴油。将植 物硫酯酶基因整合到大肠杆菌将正常的脂肪酸生物合成转变成适合用于生物柴 油的脂肪酸的合成。然后,将基因整合进去为了使酶作用生成乙醇,使酶结合乙 醇和脂肪酸生成脂肪酸乙酯,可用作生物柴油[22]。生物柴油的产量至少十倍, 对商业可行的加工仍很低,但是进一步设计将会增加产量。 蛋白质工程的新概念 酶性质较大变化通常需要多个氨基酸的替换, 因为它们可引起蛋白质结构的 较大的改变。 然而, 多个氨基酸同时替换形成指数增长的更多的突变体需要检测。 一个 200 个氨基酸的蛋白质任意两个同时替换就有 7,183,900 种可能,任意三个 同时替换就有 9,008,610,600 种可能。许多这些突变体是无活性的,而且要么对

10

产生的所有的突变体进行检测以发现活性提高的突变体, 要么仅筛选部分数据库 并且需要随后的进化循环增加优化的酶。 最简单的解决方法是更有效地筛选。 底物特异性的改变可能通过高通量的方 法进行检测, 例如荧光激活细胞分选[55-57], 可以在很短的时间里筛选数以百万 的突变体。Whittle 和 Shanklin 在一种脱氢酶的活性位点同时替换六个氨基酸, 然后筛选出一种不同底物存在的生长菌体。 仅有一些突变体底物特异性改变的菌 体可以生长[58]。 Seelig 和 Szostak 从非常大的随机数据库 (多达 1013 个突变体) 中筛选出的突变体可以催化 RNA 基于与产物结合而不是原材料的连接成一列 [59]。 目前, 得到多个突变体最好的办法是将它们同时整合,仅用统计学或生物信 息学方法限制其选择。统计相关性方法是基于用 ProSAR(蛋白质结构活性关系) 算法,Codexis 研究人员用其提高卤醇脱卤酶的反应速率 4,000 倍[60]。研究人员 用得到的脱卤酶的氨基酸随机替换(平均十个) ,测量突变体的催化速率。然后 用统计学方法确定特定的替换是否是有益的。例如,包含 Phe186Tyr 的突变体通 常比不含此突变的更有益。 一些含有这样的替换的突变体没有效用,是因为其他 突变体的不利影响。但是统计分析表明,通常 Phe186Tyr 是有利突变。最终改进 的酶 254 个氨基酸中包括 35 个氨基酸替换。 γ -蛇麻烯合成酶催化法尼酰基二磷酸的环化,经过阳离子中间体其中 45% 生成γ -蛇麻烯,但是形成少量的 51 种其他的倍半萜烯。Keasling 及其同事将活 性位点的氨基酸残基逐步进行替换,确定了每一个残基对产物分布的贡献[61]。 其他倍半萜的其中一种的有助形式与替换结合。例如,一个三重替代得到的酶生 成 78%的 sibirien;天然存在的酶只生成 23%的 sibirien。 另一种方法是限制活性位点变化的位置和那些已知来自序列对比在这些位 点经常发现的变化的类型。 Jochens 和 Bornscheuer 用这种方法增加了荧光假单 胞菌酯酶的对应选择性。有 160,000(204)种方法同时改变底物活性位点四个邻 近的氨基酸。 研究人员对比>2,800 个相关酶的氨基酸序列确定哪些氨基酸是这些 位置最常见的。 这一分析限定了数百种突变体的可能性,检测发现其中具有所需 选择性的两点突变体和三点突变体[41]。另一个多点突变重要的优势是因为突变 常使蛋白质不稳定[62-64], 因此从一个相当稳定的蛋白质开始使得其可以耐受数 量更多范围更广的变化[65,66]。 因为筛选包括多点突变的较大数据库的工作量随着数据库的大小成指数增 加,大部分研究人员从事于有利突变通常是累加的[67],除了邻近的变化以外协 同效应很罕见的假说。事实上,结合有利的单点突变体通常得到累加提高(例如 枯草芽孢杆菌酯酶在有机溶剂中稳定性的增加[68]或是铜绿假单胞菌中脂肪酶 对应选择性的提高) 。然而,通常这些贡献不能完全累加或是获得出乎意料的特

11

性。例如,突变体 A 和 B 本身可能都是有害的,但是两者结合可能是有利的。 Weinreich 及其同事[70]研究具高活性的β -内酰胺酶进化中协同相互作用。突变 体 A 提高反应速率而降低β -内酰胺酶稳定性。整体效果只是稍微改善。突变体 B 不影响速率但增加稳定性;对其本身没有作用。突变体 A 和 B 结合具有显著 地改善因为β -内酰胺酶作用更快,并且保持其稳定性,但是增加了突变体将逐 步地尽可能地失去协同的这些作用。Reetz 和 Sanchis 得出类似的结论,在检测 突变体的逐步累加可增加对应选择性[71]。当其中一个突变体是稳定的突变体而 这些突变体在其附近时, 协同效应非常重要。由于基因突变前蛋白质的稳定性可 以使稳定突变的非累加性的复杂性最小化, 但由于附近突变的非累加性的复杂性 是常见的,很难避免。 因此,蛋白质改进中造成有利变化的范围在过去十年里大幅增大。21 世纪 00 年代早期,1-5 点突变体是典型的,而到 2010 年,30-40 氨基酸替换已变得平 常。例如,为改造阿托伐他汀(立普妥)侧链(图 3) ,对卤醇脱卤酶进行定向 进化对 254 个氨基酸改变了至少 35 个[60](>14%),为改造西他列汀(图 4) ,对 转氨酶进行定向进化 330 个氨基酸改变了 27 个[17](8.2%) 。类似的,计算机设 计的逆醛缩酶需要原酶 8 或 12 个氨基酸替换(4-6%) ,这是一个由 197 个氨基 酸组成的木聚糖酶[72]。 过去十年里研究的另一种方法是新型,往往是非天然的,催化活性的创造。 这个新活性的出发点通常是一个催化混杂的反应。 催化混杂性一个活性位点具有 催化不止一种催化类型的能力。 通常情况下, 酶催化一个正反应及额外的副反应, 可能会涉及到共同的催化步骤。 新的反应类型不只是取代基添加到底物上,还涉 及到不同的过渡态和/或形成不同类型的化学键。例如,丙酮酸脱羧酶通常将丙 酮转化为乙醛和二氧化碳。 然而,丙酮酸脱羧酶的混杂催化活性是在酮醇缩合反 应中乙醛和另一个乙醛的结合。 这样一个非天然存在的丙酮酸脱羧酶催化的乙醛 苯甲醛的缩合是 BASF 公司 20 世纪 90 年代发展起来制造药物麻黄素前体的工业 生成过程的基础。 最近, 蛋白质工程加强丙酮酸脱羧酶催化酮醇缩合的混杂性的 能力[73]。正常反应需要一个质子转移,但混杂反应不需要。单个氨基酸替换去 除一个质子供体使正常活性缺失而混杂活性增加了约 5 倍。 这种缺失不必要的途径而增加所需产物的通量的方法通过第三次浪潮先进 的代谢途径工程得到进一步发展。 这使得次级代谢中更复杂的途径转变成创造新 型生物体和全新生物化学途径成为可能,来生成医药中间体和生物燃料。 萜类, 氨基酸以及脂肪酸的正常代谢都已被重新设计以生成烃类,醇类及多 聚酯用作燃料,散装化学品和塑料(见上文) 。 生物催化工程存在的挑战 尽管有所进展, 充分利用生物催化的优势仍存在重大挑战。酶工程发展速度

12

远远超过十年前, 但改变 30-40 个氨基酸并筛选数以千计的候选突变体仍需要大 批的研究队伍。即使不是全部,也有许多设计策略将产生改进的突变体,而一些 则将产生更有利的突变体而且更快的找到它们。那些策略是更具优势的让不清 楚。 对这些策略遇到相同的问题进行对比,验证不同策略背后的假设将会找出最 有效的一种。 第一个假设是利用酶工程可以达到目标。 涉及到非天然存在底物的热力学反 应可能比涉及到天然底物的反应更不利进行, 并且获得某种酶的活性可能是热力 学不可能的。 扩散设置了反应速率的上限。热力学与生物催化过程紧密结合的发 展是设计新方法更加可取的。 蛋白质工程往往依赖已知的酶的四级结构,因为蛋白质-蛋白质界面的残基 可影响到其稳定性。研究人员认为反应条件下的酶的结构(低浓度酶,高底物浓 度,有机溶剂等)与晶体酶的结构(高酶浓度,无底物和/或有机溶剂)是极其 相似的。 因为蛋白晶体只在大量实验中狭窄的条件下发现,在溶液中除了晶体结 构中看到的构想外,它们可能具有许多构想。另外,我们对蛋白质动力学的理解 仍非常有限,而且使预测变得困难。 第三,酶工程假定个别突变是累加的[67]。尽管突变体大多是没有相互作用 的, 但许多相互作用的突变体则是相当有价值却很难研究的。确定协同作用的一 种方法涉及到利用 ProSAR 算法的统计学分析[60],但需要用于蛋白质工程早期 预测更有利的技术对额外的突变也许会累加,进入一个死胡同。 第四,新型酶的活性的计算机设计是不精确的。设计仍需要验证 10-20 个预 测,而且通常结果是具有较低活性的酶,然后需要大量的进一步的设计。例如, 最初用于西他列汀[17]加工的酶基于计算机的设计获得一种酶,一天只转换 0.1 分子的底物分子, 然而来自晶体结构的计算机模型内的的活性位点与底物是充分 结合的。 设计自然界不存在的催化反应 (Kemp-消除反应[2 8], 新型 Diels–Alder 反应[74])的新型酶,但目前为止这些活性实际应用性太低。因此需要对酶催化 热力学,动力学,结构方面进行更全面的理解。 技术的挑战也限制了生物催化。目前 DNA 合成方法接近其极限,但成本仍 将近每个碱基 0.35 美元(每 1000 核苷酸基因 300 美元) ,这对数以千计的基因 的大规模应用的成本太高。更长更廉价的 DNA 片段将简化和加速后续试验。下 一代 DNA 合成方法可能涉及到密码子(三核苷酸)寡核苷酸而不是单个核苷酸 的合成。20 年前首次提出这一方法,但从未成为主流,大概是由于仪器的局限 性(合成起始于 64 个亚磷酰胺三核苷酸) 。然而,最近这一概念被用于单一合成 以及高质量突变数据库的编制过程中快速组装全基因序列[75],因此现今看似可 行。 生物催化剂和纳米元件整合的新思想以及多酶装配的复合体对未来带来了

13

希望。 生物催化早期酶固定化已成为一种策略,但当生物催化剂表面定位得到控 制时,酶固定化变得更有效[76]。类似的,多酶途径中利用蛋白质和核酸支架控 制酶的数量的定位也提升其效率[77]。另外,像碳纳米管和量子点的函数矩阵可 以代替复杂的生物电子传输系统, 为再生氧化还原催化剂和连接酶半导体提供新 方法[78]。然而,酶与非生物基质和纳米材料的整合,作为代谢工程的一部分仍 是低效的。 未来的蛋白质工程必须通过单个生物催化剂与其他代谢途径中的蛋白 质或支持基质的结合的设计接受挑战。 蛋白质工程解决了生物催化剂早期的缺点:低稳定性和对异常底物的低活 性。大量的蛋白质用于弥补低活性的缺点,这样造成乳化,限制了反应起始,降 低产量。 高活性酶因为少计量的蛋白使用不会乳化而解决这一问题。生物催化剂 和化学催化剂的化学家的培养将帮助他们在每一种情况下都可以选择最佳解决 方案。 在有机溶剂中具有长保质期和良好活性及稳定性的酶应有助于生物催化向 工业实验室进一步发展。 蛋白质最新进展已获得将小鼠蛋白转变成人类蛋白的等价物。 小鼠和人相似 蛋白的氨基酸序列通常有 13%差异(见 79)。 当今先进的蛋白质工程进行类似的变 化以将野生型酶转化成一种适合化工过程应用的酶。 这一蛋白质工程等同于将幼 年哺乳动物 75,,000,000 年的进化经过几个月的实验室工作压缩到现代小鼠和人 中。与对这些蛋白质所做的更广泛的变化一致,性质也显著变化。酶的催化性质 数以万计的因素得到改进[80],工程酶目前可以在异常苛刻的条件下起作用。对 兴建在生物催化第三次浪潮的蛋白质工程的理解,在酶学性质得到显著地改善, 实现了与化学合成需要的这些催化剂并行的发展, 使得生物催化发展成为一项化 学合成中日益重要的工具。

14


赞助商链接
相关文章:
nature上的一篇文章--如何成为一名好的研究生
nature上的一篇文章--如何成为一名好的研究生_研究生...自然》 ,第 441 期,2006 年 5 月 11 日 翻译...阅读与你的研究领域直接相关的文献,当前的和过去 的...
外文翻译要求
外文翻译要求 毕业设计(论文)外文文献翻译要求 根据《普通高等学校本科毕业设计(论文)指导》的内容,特对外文文献翻译提出以 下要求: 一、翻译的外文文献的字符要求...
文献翻译心得
英文文献翻译心得体会 历经 10 周的时间,终于将这翻译搞定,其中各种艰辛无以言表,但是既然是心得体会, 我想有必须写下,来表达我这过程中的一些体会。 说实话,...
NATURE-OF-RELATIONSHIP-MARKETING关系营销的本质大学...
NATURE-OF-RELATIONSHIP-MARKETING关系营销的本质大学毕业论文外文文献翻译及原文_高等教育_教育专区。毕业设计(论文) 外文文献翻译 文献、资料中文题目:关系营销的本质 ...
会计舞弊财务舞弊外文翻译文献
会计舞弊财务舞弊外文翻译文献_财务管理_经管营销_专业资料。会计舞弊财务舞弊外文...nature of accounting irregularities they committed; and (2) to highlight ...
工程管理专业外文文献翻译(中英文)
暂无评价|0人阅读|0次下载|举报文档工程管理专业外文文献翻译(中英文)_建筑/土木...has failed to understand the nature of uncertainty and risk in project work...
手把手教你把一篇pdf英文文献瞬间翻译成doc格式的中文
手把手教你把一篇pdf英文文献瞬间翻译成doc格式的中文_教育学/心理学_人文社科_专业资料。手把手教你把一篇 pdf 英文文献瞬间翻译成 doc 格式的中文一、准备工作:...
工程监理中英文对照外文翻译文献
暂无评价|0人阅读|0次下载工程监理中英文对照外文翻译文献_英语学习_外语学习_教育专区。工程监理中英文对照外文翻译文献 中英文对照外文翻译 Engineering supervision ...
自然科学中英文对照外文翻译文献
暂无评价|0人阅读|0次下载自然科学中英文对照外文翻译文献_电力/水利_工程科技_..., are understood, and obtain an interest which concerns our whole nature. ...
逆变器外文文献及翻译
外文文献及其翻译 13页 4下载券逆​变​器​...nature as opposed to the sinusoidal waveform that...以使三次谐波及其倍数 被取消 4 4.1 历史早期的...
更多相关标签: