Angew. Chem. :​利用二核苷酸进行12个RNA碱基的无酶复制

  • A+

众所周知,大自然利用半保留复制传递遗传信息。而磷酸二酯键的形成是链的形成与基因复制过程的分子基础(图1A)。鉴于RNA病毒的存在以及RNA的催化能力,有科学家认为在生物进化的早期可能是由RNA来完成自我复制的过程(图1B)。且在这一过程中可能不需要酶的参与,而是使用带有有机离去基团的活化核苷酸。


尽管从概念上而言无酶复制RNA是很好理解的,但在实验中复制出足够长的序列来编码一个非常短的核酶仍然具有很大的挑战性。一个重要的原因是无酶反应的序列依赖性。在研究初期,使用的模板是均聚物,如poly(C),但这种均聚物模板并不能作为有效的基因信息;当模板为混合序列时,则会表现出较差的复制效果。时至今日,即使使用预先活化的单体和三聚体的组合,并给它们加上已知的最好的有机离去基团,仍然不能得到超过7个核苷酸的有效复制。


此外,科学家们在研究中发现随着单体浓度的增加,废单体(活化单体的水解产物)会通过占据延伸位点从而抑制活化单体的掺入,这也是无酶复制长度受限的一个原因。这个问题可以通过定时更换废弃单体或在原位重新激活游离核苷酸来解决。而弱碱基配对引起的模板效应较差这一问题,可以通过使用能与链形成更强堆叠作用的“构建模块”来减轻。


斯图加特大学有机化学研究所的Clemens Richert教授采用原位激活、具有强配对能力的构建模块和已知能够支持无酶复制的序列进行RNA无酶复制的研究。除此之外,本文选择了单核苷酸和二核苷酸来克服已知系统的不良性能。最终,以C和G为碱基的二核苷酸混合物在无酶的条件下于水溶液中复制得到了长为12个核苷酸的RNA序列。

图1. 磷酸二酯键的形成机理与RNA分子进化的可能步骤

图2中展示了在本研究中所使用的RNA序列。将RNA链和未激活的单核苷酸或二核苷酸溶解在缓冲液中,4℃下反应。缓冲液中含有1-乙基-3-(3-二甲基氨基丙基)碳二酰亚胺(EDC)作为缩合剂,1-乙基咪唑作为有机催化剂。在一定的时间间隔后抽取样品使用MALDI-TOF质谱法进行分析。

图2. 基因复制反应的示意图

第一个实验采用模板1和引物2,待复制的模板区域长度为10个核苷酸。质谱结果显示,以单核苷酸CMP和GMP为构建模块时,扩增产物3-12很少,其中扩增产物3为主要产物(图3A)。当改用二聚体CG和GG时,质谱结果显示,可以得到10个核苷酸的全长产物(图3B)。通过五步反应得到的产物12总收率为18%。相应的,对同时含有单体和二聚体的混合物反应后的分析得到了类似的结果(图3C)。当使用含C/G所有四种可能的二核苷酸的混合物时,MALDI质谱同样可以检测到全长产物(图3D)。此外,二聚体之间的自配对可能抑制与模板的结合,进而影响序列的复制。接着,作者探究了基于二聚体的复制反应是否能容忍适度水平的弱配对碱基(A和U)。为此,作者使用了模板13,其特征是模板区域包含所有4种典型碱基,其中有3个是A或U。与之前的结果类似,单核苷酸的复制效果较差。当反应混合物中存在二聚体AG、CG、GG和UG时,相同时间后也得到全长产物(图3E)。虽然这些结果表明这一反应过程中可以容忍一些弱配对碱基,但在此之前作者对所有可能的二核苷酸序列单独掺入的研究表明,仅由A和U组成的二聚体其产率较低(3%),而最有利的二聚体(AU)仅为56%,这使得在当前反应条件下不太可能成功复制富含A/U的序列。


在实验部分的最后一个分析中,作者使用了模板22,一个具有十二个碱基的模板。使用C/G所有四种可能的二核苷酸的混合物进行反应,结果显示,对于产物23,检测到了一个清晰可见的峰值,代表着总共延长了十二个碱基(图3F)。

图3. MALDI-TOF质谱分析复制产物

为了深入了解所使用的序列在复制方面的独特能力,作者最后通过计算的方法对模板序列如何影响二聚体的无酶复制进行了探索性研究。从动力学数据中提取CG、GG、GC和CC连接的有效速率常数后,作者推断出复制出1024个可能的模板序列所需的时间,这些模板序列由10个碱基组成,仅由C/G核苷酸组成。图4A展示了计算得到的复制时间的分布情况,包含相同数量G核苷酸的序列被绘制到同一组中(即图4A中一竖列中的一个或多个圆圈)。从这一探索性数据的图表中可以看出,实验模板1在含有三个G核苷酸的序列中排名最好,另外还有9个这样的序列(预测的复制时间相等)。对于这10个序列,计算出的复制时间只比复制最快的poly(C)序列长20%左右。此外,实验序列的反向互补链,似乎也很适合复制(在图4A中红圈标记部分)。为了根据序列的“可复制性”对序列进行排序,作者还计算了每个序列自我复制的时间,即序列及其反向互补链的复制时间之和,见图4B。结果说明,实验模板1(红色圆圈)的自我复制时间在序列(GC)5的45%以内,后者是用二聚体进行无酶复制速度最快的模板序列。与无基因特性的序列(GC)5不同的是,实验序列1连同其9个等效快速复制序列提供了一组既可以编码信息同时在动力学上也非常适合无酶复制的序列。

图4. 无酶复制和二聚体复制的计算探索

总而言之,本文以C和G为碱基的二核苷酸混合物在水溶液中无酶复制了多达12个核苷酸的RNA序列。成功在4℃和pH 6.0的条件下原位活化单体进行了无酶复制。当二聚体和单体相互竞争时,二聚体比单体更好地支持RNA无酶复制,并且在质谱中很少发现错误的掺入。使用速率常数的模拟结果证实了混合的C/G序列二聚体是成功复制的良好候选者。这一结果支持了RNA的进化场景,包括以无酶的方式形成和复制RNA链。

文信息

Enzyme-Free Copying of 12 Bases of RNA with Dinucleotides

Gabrielle Leveau, Dr. Daniel Pfeffer, Dr. Bernhard Altaner, Dr. Eric Kervio, Franziska Welsch


Angewandte Chemie International Edition

DOI: 10.1002/anie.202203067


weinxin
我的微信
关注我了解更多内容

发表评论

目前评论:0