微生物具有利用各种碳源的固有能力,但由于代谢效率低,它们往往表现出低于标准的适应性。为了测试细菌菌株是否可以最佳地利用多种碳源,大肠杆菌在L-乳酸盐和甘油中连续进化。这产生了两个终点菌株,它们首先在L-乳酸中进化,然后在甘油中进化,反之亦然。在碳源专家和多面手突变体的协同作用下,终点菌株在单一和混合适应性碳源上表现出普遍的生长优势。仅 glpK,ppsA,ydcIg l p K, p p s A, y d c I 和 rph-pyrEr p h-p y r E 的四个变体的组合占了超过 80%80 \% 的终点菌株适应性。此外,机器学习分析揭示了赋予基因表达的条件特异性调节的转录调节因子的协调活性。 在单碳和混合碳培养条件下,连续自适应实验室进化(ALE)计划在生物生产应用中的有效性进行了评估,其中连续ALE菌株表现出上级的生产力的乙偶姻相比,祖先菌株。总之,系统水平的分析阐明了系列进化的分子基础,这在生物生产应用中具有潜在的实用性。
1.介绍
主力微生物具有多功能的代谢能力,允许吸收和转化不同的化学物质从一种形式到另一种形式。这种代谢的多功能性长期以来一直被用于生物化学品的生产(Lee等人,2019),现在越来越多地用于可再生废物的生物转化,以满足日益增长的可持续性需求(Zhang et al.,2016年)的报告。微生物生物转化通常需要使用功能通用的细菌来转化低价值的生物质,例如工业副产物(Kim等人,2022)、微生物发酵废物(Seong等人,2020)和其他固体废物(Zhang et al.,2016年,成为增值产品。
碳源通常是次优的,并且必须克服几种碳化合物的固有毒性以实现有效的生物转化。例如,E.大肠杆菌菌株K-12在甘油中表现出次优适应性(Ibarra等,2002),可能是由于限制甘油摄取的有毒中间体(Booth 2005),但是这种次优表型可以通过ALE(也称为实验进化)重新配置(Jin et al.,1983年)。出于这个原因,替代碳源的微生物生物转化通常伴随着ALE以提高底物利用率和生物转化效率(Kim等人,2023年)。
在ALE的第一阶段,在前300-400代乳酸和甘油适应谱系(下文分别为“LA”和“GL”)中观察到菌株适应性的快速增加。增量斜率在第800代达到稳定,这表明ALE的终点(Sandberg等人,2019年)(图1A)。这种适应性轨迹与我们先前的发现一致,其中800代进化时间尺度为关键有益突变的固定提供了足够的窗口(Kang等人,2019年)。在达到第800代时转换碳源,并且LA和GL谱系在转换的碳源上再繁殖600至800代,直到达到适合度平台。值得注意的是,菌株GL的倍增时间似乎接近于野生型的倍增时间,而菌株LA在碳移位时受到最小的干扰。 我们推断,这种分歧归因于在LA中获得多面手突变体 rph-pyrEr p h-p y r E ,这将在随后的部分中进一步描述。总之,系列ALE实验产生了乳酸-甘油(LA-GL)和甘油-乳酸(GL-LA)终点菌株,这些菌株在两种不同的适应性环境中经历了1400至1600代ALE。
在菌株LA中,显著的致病突变体是代谢和调节基因的突变体,其出现的顺序为rph-pyrE(RNA酶PH/乳清酸磷酸核糖基转移酶)、hfq(RNA结合蛋白)、cyaA(腺苷酸环化酶)、ppsA(磷酸烯醇丙酮酸合成酶)和 ydcIy d c I (推定的转录调节因子)(图1 E)。值得注意的是,在rph的 3^(')3^{\prime} 末端的基因间区域中的69 bp缺失(下文称为rph-pyrE(del)),这是第一个在第50个累积世代达到100%群体频率的突变,这强烈地表明了选择优势。rph-pyrE缺失突变是大肠杆菌中高度重复的突变。大肠杆菌MG 1655在营养有限的条件下,如通过在独立ALE实验中的绝对重现所证明的(Escheuf等人,2019年)。 该突变使 rphr p h 的终止密码子移动经过pyrE之前的衰减环,从而减轻对 pyrE\operatorname{pyrE} 的转录抑制,这是由 rphr p h 基因中的点缺失引起的(詹森1993; Turnbough和Switzer 2008)。
这种转录水平控制在ppsA突变体中也是相关的,其中证明了 ppsAp p s A 中的突变通过基因表达的上调而不是酶动力学在乳酸盐存在下赋予选择性优势(Conrad等人,2009年; Fong等人,2005年)。由于产异生碳底物乳酸的流入指向磷酸烯醇丙酮酸-磷酸烯醇丙酮酸节点,因此推测 ppsAp p s A 的上调在异生过程中是有利的。ppsA( 72T > G72 \mathrm{~T}>\mathrm{G} )中的点突变出现在乳酸ALE的中间,随后是调节基因 hfq(142A > T)h f q(142 \mathrm{~A}>\mathrm{T}) 和cyaA( 2336T > G2336 \mathrm{~T}>\mathrm{G} )中的突变(图1 E)。此外,cyaA的突变衍生物对非PTS碳源(包括乳酸盐和甘油)表现出适应性优势,在平行ALE实验中具有高频率的固定,这可能是由于其在细胞内cAMP调节中的作用(Conrad et al.,2009年; Herring等人,2006; Peabody等人,2017年)的报告。
另一方面,已显示 hfqh f q 突变体在各种次优营养限制培养条件下赋予生长优势(Conrad等人,2009年; Maharjan等人,2013; Wang等人,2010),主要是通过上调转运蛋白表达来增加限制性碳底物的转运(Maharjan et al.,2013年)。最后,在第600代中观察到 ydcI(5A > C)y d c I(5 \mathrm{~A}>\mathrm{C}) 突变体(图1 E)。先前的研究表明YdcI参与细胞持久性(Hingley-Wilson等人,2020),pH稳态和醋酸盐
代谢(Gao等人,2018年)。然而,在多个ALE实验中 ydcIy d c I 突变体复发背后的生物学仍不清楚。
GL中发现的致病突变包括rpoC(RNA聚合酶亚基)和glpK(甘油激酶)(图1D)。每个突变体出现在ALE的早期阶段。已显示rpoC中的缺失突变诱导全局代谢重新布线,其将细胞资源重新引导到生物质形成中,同时减少非必需代谢途径中的浪费性溢出(Cheng et al.,2014年)。相比之下,glpK中的突变通常使对GlpK的变构抑制失效(Applebee et al.,2011),其触发甘油的过量摄取,这可能导致碳溢出(Basan等人,2015年; Cheng等人,2014年)。rpoC和 glpKg l p K 突变体是正上位的,并且协同作用以改善菌株对甘油的适应性,其中双重突变体可以代表终点菌株中接近100%的适应性增益(Herring等人,2006年)。 两者合计,适应性变化的应变LA和GL是类似的,以前记录的,适应性进化的结果在类似的选择压力下的再现性。
2.3.适应性进化第二阶段的突变谱
接下来,我们检查了ALE第二阶段(LA-GL和GL-LA的终点谱系)中的突变谱。出乎意料的是,我们观察到在甘油上的ALE的第二阶段中 ppsA(72T > G)p p s A(72 \mathrm{~T}>\mathrm{G}) 和 ydcI(5A >y d c I(5 \mathrm{~A}> C)的等位基因频率快速下降(图1D和E)。这是因为在乳酸盐进化结束时,两种突变都没有完全达到固定频率。快速清除还表明,在甘油条件下,两种突变体的适应性可以忽略不计,这得到了对复溶突变体进行的适应性试验的支持(图1F和G)。
LA-GL和GL-LA的突变谱再现了最初在LA和GL中发现的一些关键突变(图1D和E)。鉴于这两个碳共享相当一部分的产甘油途径,在乳酸进化过程中获得的突变可能在甘油限制条件下有益,反之亦然。事实上,在代谢相似的碳基质混合物上的适应性进化倾向于产生对所有碳源具有生长优势的单一通才,而那些不相似的碳基质则产生专家亚群(Sandberg et al.,2019年)。为了解决这个问题,我们进行了适应性分析的重建突变与乳酸和甘油生长条件下的单突变和多突变。
在两种生长条件下测量每个突变体的比生长速率,以计算在终点谱系中适合度的贡献百分比。通过这种方式,我们量化了每个突变体的适应度贡献。此外,两种培养条件的适应性比较可以帮助推断突变体的性质,无论是作为一个多面手表现出对甘油和乳酸的适应性优势,或作为一个专业的突变体,在特定的条件下的行为方式。例如,众所周知的“甘油专家”突变体衍生物 glpKg l p K ( 694G > T694 \mathrm{G}>\mathrm{T} )和glpK(189 A > C)特别对甘油造成最大的适应性增加,对乳酸的影响可忽略不计(图1F和G)。另一方面,rph-pyrE(del)是对乳酸最适合的单一突变体,并且是对甘油的第二大适合性贡献者,突出了rph-pyrE(del)突变体的通才性质,如先前报道的(Kang等人,2019年)。
类似地,从两种培养物下的平行适合度贡献判断, hfq(142A > Th f q(142 \mathrm{~A}>\mathrm{T} )也显示出通才样表型
条件(图1F和G)。最后,连续突变体的适应性评估,其目的是概括的时间顺序突变收购的GL-LA和LA-GL谱系,揭示了洞察突变之间的潜在相互作用。以GL-LA谱系为例,虽然 ppsA(13G > T)p p s A(13 \mathrm{G}>\mathrm{T}) 单独缺乏对甘油的适应性没有贡献,但 glpK(694G > T)g l p K(694 \mathrm{G}>\mathrm{T}) 和 ppsAp p s A(13G > T)(13 \mathrm{G}>\mathrm{T}) 双突变体的适应性贡献比 glpKg l p K 单独单一突变体的适应性贡献高 15%15 \% (图1F)。这表明在甘油中两种突变体之间存在协同相互作用,这是出乎意料的,因为ppsA突变体的出现仅限于乳酸盐生长条件(Conrad等人,2009年; Herring等人,2006; Kang等人,2019; Kim等人,2022; Peabody等人,2017年)的报告。类似地,与三突变体相比,包含所有四个单突变体的组合突变体显示出适应性贡献的急剧增加(图1B)。 1F),强烈暗示存在由第四突变体rph-pyrE(del)赋予的协同相互作用。相反,在获得 hfqh f q (142 A > T)后,在连续突变体中观察到适合度贡献的降低(图1G),表明拮抗相互作用。这种拮抗作用归因于hfq突变体的生长依赖性,它对生长缓慢的细胞有利,但限制了生长快速的细胞群的生长(Maharjan等人,2013年)。尽管组合突变形式存在明显的适应性缺陷,但hfq突变体的选择基础仍然难以捉摸。类似地,cyaA( 2236T > G2236 \mathrm{~T}>\mathrm{G} )单突变体对乳酸的适应性显著降低,考虑到cyaA( 2236T > G2236 \mathrm{~T}>\mathrm{G} )对甘油利用的有益作用,这是出乎意料的。另一个未预料到的观察结果是 ydcIy d c I 突变衍生物 ydcI(5A > Cy d c I(5 \mathrm{~A}>\mathrm{C} 和 ydcIy d c I (686-7insG)的适合度贡献可忽略不计,与培养条件和遗传背景无关。 需要进一步研究 ydcIy d c I 突变体在菌株适应性中的作用,以解释 ydcIy d c I 突变体在独立ALE实验中的高重现性。
为了深入了解混合碳环境中适应性改善的遗传基础,我们测量了混合碳条件下每个突变体的适应性。有趣的是, glpK(189A > Cg l p K(189 \mathrm{~A}>\mathrm{C} 和694G > T>\mathrm{T} )和 ppsAp p s A ( 72T > G72 \mathrm{~T}>\mathrm{G} 和13G >> T)突变体的适合度贡献(它们中的每一个代表甘油和乳酸盐专门突变)保持与亲本野生型几乎相似
图2. - 混合碳条件下的菌株生长表型。
(A)终点菌株在含甘油和乳酸盐的混合碳基本培养基中的生长曲线。野生型和进化菌株之间的(B)比生长速率(SGR)和比碳吸收速率(CUR)的比较。(**)表示P值小于或等于0.01。误差线代表生物学三份重复样品的标准差。(D)GL-LA和(E)LA-GL在混合碳条件下获得的单个和连续突变体的适合度贡献。注意 glpKg l p K 和 ppsAp p s A 变体中的适应性效应减弱。( FF )在 glpKg l p K 和 ppsAp p s A 变体背景中引入 rph-pyrEr p h-p y r E (del)突变似乎赋予正上位相互作用以拯救和加强混合碳条件下相应突变体的适应性效应。
应变(图2D)。这是出乎意料的,特别是对于 glpKg l p K 突变体,其占多达 40%40 \% 的GL对甘油的适应性改善(图1)。相反,一个值得注意的适应性贡献来自多面手突变体rph-pyrE(del)以及具有 glpK(694 G > )g l p K(694 G>) )、ppsA(13 G> T)、pepcI(686-7insG)和rph-pyrE(del)的四重突变体。特别地,与rph-pyrE(del)单突变体和 glpK(694G > T)-ppsAg l p K(694 \mathrm{G}>\mathrm{T})-p p s A (13 G> T)-pyrcI(686-7insG)三突变体相比,四重突变体适合度分别增加了近47%和75%(图2D)。rph-pyrE(del)介导的适合度恢复在LAGL基因型中也是相关的(图2 E),强烈暗示rph-pyrE(del)通过在现有的专门突变之间施加正上位相互作用而在混合碳条件中起关键作用。
这促使我们测试在 glpKg l p K 和 ppsAp p s A 单突变体背景中掺入rph-pyrE(del)是否会导致在混合碳条件下菌株适应性的协同增加。为此,我们构建了 glpK(694G > T)-rph-pyrEg l p K(694 \mathrm{G}>\mathrm{T})-r p h-p y r E (del)和ppsA(13 G> T)-rph-pyrE(del)的双突变体对。令我们惊讶的是, glpKg l p K 和rph-pyrE(del)双突变体的适合度贡献是rph-pyrE(del)单突变体的两倍,并且在ppsA-rph-pyrE(del)双突变体中增加了至少 8%8 \% (图2F)。这有力地支持了rph-pyrE(del)不仅用于拯救,而且还
接下来,使用全转录组测序(RNA-Seq)来分析进化群体在各自的进化介质以及混合碳条件下的全局转录组状态的变化。主成分分析(PCA)聚类以条件特异性方式揭示了个体菌株的最佳基因表达状态(Sandberg et al.,2017年)的报告。共享共同进化历史的菌株聚集在“转录组最优性”的类似区域中(图3A)。有趣的是,我们在转录组水平上观察到进化轨迹的明显分歧
代谢(补充图S3)。首先,DEG分析显示进化菌株之间的基因表达存在条件特异性差异,这在与碳吸收相关的基因中最为明显。值得注意的是,与野生型菌株相比,分别编码L-乳酸通透酶和L-乳酸脱氢酶的lldP和lldD在M9乳酸盐中的所有乳酸盐进化菌株中显著上调,如先前报道的(Hua et al.,2007年)。同样值得注意的是,在M9甘油中glpK(GL、LA-GL和GL-LA)中携带错义突变的菌株中, glpKg l p K 显著下调。这是由于细胞中增强的甘油摄取导致细胞内甘油3-磷酸浓度升高,这又抑制腺苷酸环化酶(补充图S4 A)(Eppler等人,2002年)。细胞内cAMP水平的下降导致glpFKX操纵子的抑制(Applebee等,2011; Cheng等人,2014年; Kim等人,2022年)。 正如所预期的,细胞内cAMP水平的定量显示,与野生型相比,携带突变体 glpKg l p K 衍生物的菌株的细胞内cAMP浓度降低高达 38%38 \% (补充图S4B)。
基于其倍数变化值的DEG的层次聚类揭示了其表达模式中的三个不同的组。首先,甘油和混合碳条件之间的DEG显示乳酸代谢基因 lldP,lldRl l d P, l l d R 和 lddl d d 的显著上调(簇1,图3B)。如前所述,这三个基因分别编码内膜通透酶、调节蛋白和乳酸特异性脱氢酶,它们的上调与大肠杆菌中更大的乳酸内流相关。大肠杆菌(Hua等人,2007年)。类似地,乳酸盐和混合碳条件之间的DEG揭示甘油代谢基因的显著增加,包括呼吸 glpKDg l p K D 和 gpABCg p A B C 途径以及发酵gldA/dhaKLM途径(簇2,图3B)(Booth 2005; Gonzalez等人,2008年)。 其中,表达倍数变化值在簇内以及所有DEG中的代表性甘油同化基因 glpKg l p K 和 glpDg l p D 中最高,进一步强调了 glpKg l p K 和 glpDg l p D 在甘油利用中的关键作用。最后一个簇的特征在于其成员在所有菌株中普遍上调,其中大多数与翻译和蛋白质生物合成功能相关(簇3,图3B)。虽然翻译机制的活性(包括转录组变化)的增加受菌株生长控制(Cummings等人,一九九一年; Forchhammer和Lindahl 1971),混合碳条件下的比生长速率与单一碳条件下的比生长速率相比并不特别高,LA-GL和GL-LA除外。然而,混合碳条件下的菌株显示出比乳酸盐或甘油中的菌株更高的最大细胞密度(图2A和补充图2B)。 S1),这与簇3中的抑制相关基因的上调一致(图3B)。据推测,在混合碳条件下的最大细胞密度的增加归因于代谢网络的拓扑结构。将输入通量有效地分配到代谢上相邻的前体库中允许更有效地合成转化为改善的生长能力的各种结构单元(Wang等人,2019年)。总之,我们确定了一个单边转录组反应的混合碳条件下,其特征在于同时上调的一个子集的基因特异性甘油和乳酸条件下,无论进化史。
2.9.控制ALE和条件特异性转录组适应的关键调节因子
为了更深入地探索系列ALE菌株中的适应性和条件特异性转录组反应,我们对我们的数据集进行了独立成分分析(伊卡),沿着PRECISE中278个表达数据的概要(Sastry等人,2019年)。伊卡产生由特定转录调节因子独立调节的基因组。基因的表达作为每个条件的函数进行定量加权,具有特定阈值以确定基因是否是iModulon中独立调制信号的一部分。因此,在一系列遗传(ALE)和环境改变之后基因表达或调节剂活性的显著变化可以在iModulon活性中显现(Kavvas et al.,2022年)。
在我们以前的工作中,我们广泛地描述了E.大肠杆菌在甘油和L-乳酸作为唯一的碳底物中进化,重点是生长表型(Fong等人,2005),适应的遗传基础(Conrad et al.,2009年; Herring等人,2006),以及转录和代谢网络(Cheng et al.,2014年; Conrad等人,2010; Utrilla等人,2016年)。在这项研究中,我们评估了E。大肠杆菌在二碳底物甘油和乳酸中进行连续适应。
突变谱的不断发展的人口揭示了高度的进化收敛,所示的因果遗传突变体的存在,有助于显着的适应性适应性观察到的终点菌株。在连续进化的种群中,适应性的关键贡献者是 glpK,ppsAg l p K, p p s A 和 rph-pyrEr p h-p y r E 的变体,这与先前关于甘油和乳酸盐限制环境的ALE实验一致(Cheng等人,2014年; Conrad等人,2009年; Herring等人,2006; Kang等人,2019年; Kim等人,2022; Peabody等人,2017年; Scheuf等人,2019年)。如先前所报道的,单个和顺序工程化突变体的特定菌株适应性在很大程度上类似于其他变体。然而,有趣的是,包括 gpKg p K 和 ppsAp p s A 变体在内的“专业突变体”的适应性效应在混合碳条件下减弱,但在引入rph-pyrE突变体后得到了挽救。 虽然这种条件特异性上位性相互作用的机制基础尚不清楚,但 rph-pyrEr p h-p y r E 突变体在缓解大肠杆菌中停滞的嘧啶生物合成中的功能属性仍不清楚。大肠杆菌(詹森1993; Turnbough和Switzer 2008)似乎暗示核苷酸生物合成和转录的参与是混合碳条件下生长的潜在瓶颈。
在进化和混合碳条件下的野生型和进化菌株的转录组图谱显示,尽管在适应性和突变图谱中存在明显的奇偶性,但在转录组水平上以lineagspecific方式在进化轨迹上存在显著的分歧。然而,基因表达变化的总体趋势,例如由于减弱的选择压力而导致的ALE第二阶段中DEG计数的减少(补充图10)。S2 B和C)(Conrad等人,2010),以及生物质和能量产生途径的典型上调(Choe et al.,2019; Kim等人,2022; LaCroix等人,2015; Seong等人,2020),在两个谱系中保持保守。伊卡分析还揭示了在进化菌株中“ALE特异性”调节器(RpoS和GadW)以及“条件特异性”调节器(GlpR、LldR、Zur和Crp-2)的单侧激活。 激活的幅度不同,这似乎反映了应变表型的适应性变化,如碳吸收和生长速率的基因表达的改变。
提高微生物对原料碳的代谢效率是细菌生物生产性能的核心。当使用非优先碳源(例如甘油和乳酸盐)作为原料碳底物时,这一点尤其如此(Fong等人,2003; Ibarra等人,2002年)。考虑到替代碳源在基于微生物的增值化合物生产中的新兴应用,工业相关细菌中固有的低效代谢被积极解决以简化替代碳源的更有效的生物转化(Elmore等人,2020年; Kim等人,2022; Seong等人,2020年; Song等人,2022年)。这种替代原料以混合物而不是单一底物的形式出现的事实(Elmore等人,2020),利用多种底物的能力在生物转化应用中至关重要。在此方面,系列ALE在提高E. 大肠杆菌值得注意。尽管在当前的研究中没有证明,但是预期将连续ALE方法与代谢工程和合成偶联策略一起组合使用协同增强生物生产性能的优化(Pontrelli et al.,2018年; Seong等人,2020年)。总之,这证明了系列ALE在利用在使可再生的异质原料增值方面优化的“底盘”菌株中的潜在适用性。
Kangsan Kim: Writing - original draft, Visualization, Investigation, Formal analysis, Data curation. Donghui Choe: Writing - review & editing, Investigation, Data curation. Minjeong Kang: Investigation, Data curation. Sang-Hyeok Cho: Investigation, Data curation. Suhyung Cho: Resources, Funding acquisition. Ki Jun Jeong: Resources. Bernhard Palsson: Writing - review & editing, Methodology, Funding acquisition. Byung-Kwan Cho: Writing - review & editing, Supervision, Methodology, Funding acquisition.重试错误原因
竞合利益声明
没有要宣告的恩怨。
数据可用性
数据将根据要求提供。
确认
这项工作得到了韩国生物大挑战赛(2018 M3 A9 H3024759 to B.- K.C.),生物医学技术开发计划(2021 M3 A9 I4024308 to B.- K.C.)和C1天然气炼油项目(2018 M3 D3 A1 A01055733至B.- K.C.)通过韩国国家研究基金会(NRF),由科学和信息通信技术部资助;韩国国家研究基金会(NRF)由韩国政府(MSIT)资助(2021 R1 A2 C1012589 to S.C.);诺和诺德基金会(NNF)生物可持续性中心(NNF 16 CC 0021858 to B. P.);以及韩国生物科学和生物技术研究所(KRIBB)研究倡议计划(KGM 5402322)。
附录A.补充数据
Supplementary data to this article can be found online at https://doi. org/10.1016/j.ymben.2024.04.004.重试错误原因
引用
Aguilera, L., Campos, E., Gimenez, R., et al., 2008. Dual role of LldR in regulation of the lldPRD operon, involved in L-lactate metabolism in Escherichia coli. J. Bacteriol. 190, 2997-3005. https://doi.org/10.1128/JB.02013-07.重试错误原因