Structure and Biophysics for a Six Letter DNA Alphabet that Includes Imidazo[1,2-a]-1,3,5-triazine-2(8H)-4(3H)-dione (X) and 2,4-Diaminopyrimidine (K)
包括咪唑[1,2-a]-1,3,5-三嗪-2(8H)-4(3H)-二酮 (X) 和 2,4-二氨基嘧啶 (K) 的六字母 DNA 字母表的结构和生物物理学
点击复制文章链接
点击复制文章链接
- Isha Singh
金明贞
金明贞 - Robert W. Molt
罗伯特·莫尔特 (Robert W. Molt
Shuichi Hoshika 星香修一 - Steven A. Benner
史蒂文·本纳
A goal of synthetic biology is to develop new nucleobases that retain the desirable properties of natural nucleobases at the same time as expanding the genetic alphabet. The nonstandard Watson–Crick pair between imidazo[1,2-a]-1,3,5-triazine-2(8H)-4(3H)-dione (X) and 2,4-diaminopyrimidine (K) does exactly this, pairing via complementary arrangements of hydrogen bonding in these two nucleobases, which do not complement any natural nucleobase. Here, we report the crystal structure of a duplex DNA oligonucleotide in B-form including two consecutive X:K pairs in GATCXK DNA determined as a host–guest complex at 1.75 Å resolution. X:K pairs have significant propeller twist angles, similar to those observed for A:T pairs, and a calculated hydrogen bonding pairing energy that is weaker than that of A:T. Thus, although inclusion of X:K pairs results in a duplex DNA structure that is globally similar to that of an analogous G:C structure, the X:K pairs locally and energetically more closely resemble A:T pairs.
合成生物学的一个目标是开发新的核碱基,在扩大遗传字母表的同时保留天然核碱基的理想特性。咪唑[1,2-a]-1,3,5-三嗪-2(8H)-4(3H)-二酮 (X) 和 2,4-二氨基嘧啶 (K) 之间的非标准 Watson-Crick 对正是这样做的,通过这两个核碱基中的氢键互补排列配对,它们不补充任何天然核碱基。在这里,我们报道了 B 型双链 DNA 寡核苷酸的晶体结构,包括 GATCXK DNA 中的两个连续 X:K 对,以 1.75 Å 分辨率测定为主客体复合物。X:K 对具有显着的螺旋桨扭转角,类似于观察到的 A:T 对,并且计算出的氢键对能比 A:T 弱。因此,尽管包含 X:K 对会导致双链 DNA 结构在整体上与类似的 G:C 结构相似,但 X:K 对在局部和能量上更接近 A:T 对。
自从第一次实验表明标准 DNA 并未利用 Watson-Crick 核碱基配对方案中所有可能的氢键模式以来,已经过去了四分之一个世纪。(1) 在标准对中,通过反平行磷酸二酯链上的 N-糖苷键连接到脱氧核糖的核碱基杂环通过氢键相互作用在 Watson-Crick 边缘上相互作用。然而,这种 Watson-Crick 几何形状可以容纳多达 12 个核碱基,形成多达 6 个正交核碱基对(图 1)。(2-6) 这些形成了人工扩展的遗传信息系统 (AEGIS)。对 AEGIS 的探索创造了新的技术和医学,因为它们为核酸的研究开辟了新的领域。(7)
Figure 1 图 1

Figure 1. Chemical structures with atom numbers for A:T, G:C, P:Z, and X:P.
图 1.具有原子数的化学结构 A:T、G:C、P:Z 和 X:P。
特别是,没有标准的嘧啶核苷酸呈现氢键供体 - 受体 - 供体模式,而嘌呤则呈现互补受体 - 供体 - 受体氢键模式。在 AEGIS 中,这种非标准模式可以通过核苷酸类似物 2,4-二氨基-5-(1′-β-d-2′-脱氧呋喃核糖基)-嘧啶(实现嘧啶供体-受体-供体氢键模式,K)和 8-(β-d-2′-脱氧核糖呋喃酰基)咪唑[1,2-a]-1,3,5-三嗪-2(8H)-4(3H)-二酮(实现嘌呤受体-供体-受体氢键模式,X)来实现。第一个核碱基 K 的 pKa 为 ∼6.7(作为游离物质,以其质子化形式)。(8) 第二个核碱基 X 的 pKa 为 ∼8.5,这里首次根据痕量 UV 作为 pH 值的函数进行了报道(支持信息图 S1)。X:K 对与自然对在两个方面不同。首先,实现供体-受体-供体氢键模式的嘧啶类似物(如 K)必须是 C-糖苷,通过碳-碳键将杂环连接到糖上。其次,该类似物将氢键供体,NH2 部分,呈现到小沟中。K 的这些特征在两个方面都与自然 T 和 C 不同。这些都是 N-糖苷,并且都在小沟中呈有一个 C═O 单位(氧是 O2)。此外,K 在第二个方面与 AEGIS 5-硝基-1H-吡啶-2-酮杂环不同(呈现嘧啶供体-供体-受体模式,简单地为 Z);Z 还为小调槽提供了一个 C═O 单元。 (9-12) 已经为 P:Z 对开发了几乎完整的分子生物学这一事实表明,具有 C-糖苷成分的对与合成生物学兼容(图 1)。
正如以前发表的工作中所指出的,这个特殊的 X:K AEGIS 对很感兴趣,因为它没有互变异构形式、质子化状态或去质子化状态,这些状态允许嘌呤或嘧啶与任何天然核碱基错配,形成具有 Watson-Crick 几何形状的对,即边上氢键对。(13, 14)因此,X:K 复制的保真度仅取决于所涉及的 DNA 聚合酶直接进行的相互作用。天然大肠杆菌 DNA 聚合酶 I 在不存在 dXTP 的情况下为含有单个 K 的模板产生很少的全长产物,但在引物延伸测定中,在没有 dKTP 的情况下掺入与 X 相反的 dTTP。(14) 这种错配是通过形成 1 型 X:T 摆动结构引起的。(13) 此外,当用含有两个连续 X:K 对的底物攻击时,DNA 聚合酶 I 难以延伸引物;无论模板包含 KK 还是 K 和 X 的混合,都是如此。(14)
在早期的工作中,黄嘧啶实现了 X 氢键模式,并使用 HIV-1 逆转录酶变体进行了五个复制循环。(12) 每个周期的保真度是通过取总体损失程度的五次方根来计算的,这是通过作为损失的结果产生限制位点来确定的。使用静止起始引物延伸研究产生损失的摆动对,然后使用凝胶电泳和条带定量分析产物。在这里,保真度是在没有补码的情况下测量的。(13)
保真度也通过参考另外两个 AEGIS 对(S:B 对和 Z:P 对)的复制保真度来评估。与 X:K 对相比,这两个 AEGIS 对可以从次要互变异构体形式或次要去质子化形式进行不匹配而不会产生几何变形。当然,确切的保真度取决于所使用的确切聚合酶、实现 X 氢键模式的确切分子以及检查保真度的确切条件。
在活细胞中检查了大肠杆菌通过错配拯救选择标记物的能力,这确保了 DNA 复制的保真度。(14) 在这里,S:B 对和 Z:P 对,没有它们的互补三磷酸盐,根据它们的互变异构形式(对于第一个)和去质子化形式(对于第二个)在很大程度上表现为预期的。(15) 错配修复酶 MutS “看到”X:K 对是合法匹配的,这意味着该 DNA 修复系统不会切除活细菌细胞中的 X:K 对。这使得 X:K 对成为作为第五和第六个 DNA 对进入生命系统的主要候选者,该 DNA 对不会受到纯粹大小互补对所显示的几何失真的影响。(16, 17)
为了以相应的方式推进 GACTKX DNA 的合成生物学,我们首先认识到核碱基在决定 DNA 双链体的整体结构和特性方面起着重要作用。(18) 一般来说,双链结构及其整体局部和螺旋参数在蛋白质结合、复制、基因调控和随后的转录事件等过程中识别 DNA 起着重要作用。探索含有非天然核苷酸的双链 DNA 的结构可以扩展我们对这种关系的理解。对具有多个连续非天然核碱基对的 DNA 双链体的研究可能比对仅包含一个核碱基对的双链体的研究提供更多信息。Z 及其伴侣 P (7-氨基-9-(1′-β-d-2′-脱氧呋喃核糖基)-咪唑[1,2-c]嘧啶-5(1H)-酮)就是这种情况,其中包含多个和连续 Z:P 对的双链体的结构和动力学研究都促进了我们对 GACTZP DNA 以及一般 DNA 的理解。(11, 19)
为了了解多个 X:K 对如何影响双链 DNA 的结构,鉴于大肠杆菌 DNA 聚合酶 I 难以掺入两个连续的 X:K 对,这一点特别有趣,我们首先检查了该系统在水溶液中的圆二色谱 (CD) 光谱。然后,我们使用主客体系统结晶 5′-CTTATXXTAKKATAAG-3′,称为 2X2K。在该系统中,莫洛尼鼠白血病病毒逆转录酶 (MMLV-RT) 的 N 末端片段(残基 24-278)作为宿主,16 聚体双链体 DNA 寡核苷酸作为客体。(20, 21)MMLV-RT 的 N 端片段由手指和手掌结构域组成,DNA 与手指结构域内涉及小沟和骨架氢键的位点结合。(22)
表 1.2X2K 的数据和优化统计量
a (Å) a (Å) | 55 |
b (Å) b (Å) | 145.6 |
c (Å) c (Å) | 46.9 |
space group 空间组 | P21212 |
resolution 分辨率 | 33.72–1.75 |
total observations 总观测值 | 484673 |
unique reflections 独特反射 | 38305 |
completeness 完整性 | 98.4 (92.3) |
Rmeas (%) R测量值 (%) | 4.2 (33.8) |
Rpim (%) Rpim (%) | 1.7 (15.4) |
I/σ 我/σ | 37.4 (4.65) |
Refinement Statistics 细化统计 | |
R value (%) R 值 (%) | 20.9 |
R free (%) 无 R (%) | 23.9 |
RMSD bonds (Å) RMSD 债券 (Å) | 0.007 |
RMSD angles (deg) RMSD 角(度) | 1.114 |
Number of Atoms 原子数 | |
protein/DNA 蛋白质/DNA | 1968/324 |
water 水 | 188 |
Average B-Factors 平均 B 因子 | |
protein/DNA 蛋白质/DNA | 24.13/48.36 |
water 水 | 26.06 |
使用宿主客体系统使我们能够比较含有非天然核碱基的 DNA 的结构与天然 DNA 双链体的结构。由于 16 个碱基对中的中心 10 个碱基对与蛋白质没有相互作用,因此 DNA 的结构由序列决定。(20,22-24)此外,不同的 DNA 序列在同一个晶格中结晶;因此,结构比较受相同的晶格约束。我们对 X:K 对的结构分析得到了静电势表面、偶极子和氢键能的计算分析的支持。
Results and Discussion 结果与讨论
Solution Properties of GATCKX
所有四个序列(AT、GC、2X2K 和 3K3X)的 CD 谱图都表现出类似 B 的特性(图 2),峰位置和峰高的细微差异与 DNA 一级序列的差异有关。富含 AT 的序列的光谱在 248 nm 附近表现出一个负峰,在大约 279 nm 处显示出一个正的、波长更长的峰,这是右旋 B-DNA 的典型特征。另一方面,富含 GC 的序列在 245 nm 左右有一个宽的负峰,而富含 GC 的序列的正峰移动到 270 nm,而不是在富含 AT 的序列中观察到的 279 nm,这仍然表明右旋 B 型 DNA。2X2K 和 3K3X 序列的谱图与富含 GC 的序列相比,其谱图更类似于富含 GC 的序列,在 250 nm 处具有较宽的负峰,在 273 nm 处具有较宽的正峰。这一发现表明,整体螺旋形式和 X:K 发色团更类似于富含 B 型 GC 的 DNA,而不是富含 AT 的 DNA。
Figure 2 图 2

Figure 2. Characterization of duplex DNA including X:K pairs by circular dichroism (CD). The ellipticity is plotted versus the wavelength for 2X2K (long dash line), 3X3K (dash dot dot line) along with control sequences for GC (dotted line), and AT (solid line). All of the duplexes have CD spectra indicative of right-handed B-form DNA.
图 2.通过环二色谱 (CD) 表征双链 DNA,包括 X:K 对。绘制了 2X2K(长虚线)、3X3K(虚线点线)的椭圆度与波长的关系图,以及 GC(虚线)和 AT(实线)的控制序列。所有双链体都有指示右旋 B 型 DNA 的 CD 光谱。
Structure of the Host–Guest Complex
为了详细了解含 XK 的 DNA,将自互补的 2X2K 16 聚体寡核苷酸结晶为主客体复合物。该系统中的宿主是 Moloney 鼠白血病病毒逆转录酶的 N 端片段。在该系统中结晶的客体 DNA 分子(包括 2X2K)在主客体复合物中是 B 型。3X3K 与含有 P:Z 对 (3/6ZP) 的相应寡核苷酸一样,未以主客体复合物的形式结晶。与 3/6ZP 相比,3X3K 的仅 DNA 晶体没有衍射到高分辨率。(11) 2X2K 晶体的不对称单元包括一个蛋白质分子和一半的自互补 16 聚体 DNA 寡核苷酸或一个 8 聚体双链体。主客体复合物由晶体对称性产生,包括两个宿主蛋白分子和一个 16 聚体 DNA 双链体(图 3)。dK 和 dX 在结构中都产生了明确的电子密度(图 3),并表现出预期的氢键相互作用,即边缘核碱基之间的三个氢键。在 2X2K 结构中,两个 X:K 核碱基对之间的氢键距离从 2.64 到 3.29 Å 不等(图 3),下面将更详细地讨论。使用该系统的一个优点是能够直接比较包含等效位置的 G:C、A:T 或 P:Z 碱基对的序列的结构,这些碱基对在相同的主客体复合物中结晶,因此受到相同的晶格约束。
Figure 3 图 3

Figure 3. Crystal structure of host–guest complex including self-complementary 16 base pair oligonucleotide. (A) The N-terminal fragment of Moloney murine leukemia virus reverse transcriptase serves as the host in the complex including two protein molecules, shown as cartoon renderings in cyan and green, and a 16-mer duplex, each strand shown as a stick rendering C, cyan or green, O, red, N, blue, and phosphorus in orange; X:K pairs are shown with C in magenta. The complex depicted is that of the host–guest complex for the oligonucleotide shown with two consecutive X:K nucleobase pairs (2X2K). Within our crystals, the asymmetric unit includes only half of the complex depicted and thus the equivalent of eight nucleobase pairs and one protein molecule, indicated by the dashed line. (B) The sequence of the 2X2K sequence and position numbering for the nucleobases within the duplex. (C) The final 2Fo–Fc electron density map is shown as gray mesh renderings contoured at 1.0 σ for the X:K pair at position 6.
图 3.主客体复合物的晶体结构,包括自互补的 16 个碱基对寡核苷酸。(A) 莫洛尼鼠白血病病毒逆转录酶的 N 端片段在复合物中充当宿主,包括两个蛋白质分子,显示为青色和绿色的卡通渲染,以及一个 16 聚体双链体,每条链显示为一根棒状,渲染 C、青色或绿色、O、红色、N、蓝色和橙色磷;X:K 对以洋红色显示 C。所描绘的复合物是寡核苷酸的主客体复合物,以两个连续的 X:K 核碱基对 (2X2K) 显示。在我们的晶体中,不对称单元仅包括所描述的复合物的一半,因此相当于 8 个核碱基对和一个蛋白质分子,如虚线所示。(B) 双链体内核碱基的 2X2K 序列序列和位置编号。(C) 最终的 2Fo-F c 电子密度图显示为 6 位 X:K 对在 1.0 σ 处等高的灰色网格渲染。
X:K 对在天然对应物中发现的大凹槽中总共有三个电负性原子,具有潜在的氢键受体,K 的 N5 和 X 的 O6,以及潜在的氢键供体,K 的 N4 氨基氨基(图 4)。G:C、A:T 和 P:Z 存在潜在的氢键受体,包括 G 或 P 的 O6 和 G 或 A 的 N7 和 T 的 O4,而 A 的 N6 氨基和 C 或 Z 的 N4 氨基可以作为氢键供体。Z 还在大沟中呈现两性离子硝基,它可以作为氢键受体。
Figure 4 图 4

Figure 4. van der Waals sphere renderings are shown with O in red, N, blue, P, orange, and C in green for X:K, yellow for P:Z, cyan for G:C, and pink for A:T for major and minor groove presentation faces of the nucleobase pairs.
图 4.范德华球体渲染以红色表示 O,X:K 以红色表示 O,以绿色表示 P:Z,以黄色表示 P:Z,以青色表示 G:C,以粉红色表示 A:T,表示核碱基对的大沟和小沟表示面。
在小沟内分别与嘧啶或嘌呤核碱基相关的氢键受体 O2 或 N3 的存在被认为是自然对 G:C 和 A:T 的基本特征,DNA 聚合酶“读取”以确保复制过程中的正确配对。(25, 26)术语“read”是指在 DNA 聚合酶和模板/引物底物之间的活性位点形成的特异性氢键相互作用。非自然的 X:K 对与天然对的不同之处在于,在 K 的小沟中没有氢键受体,而是有一个氢键供体,即 N2 氨基,而非自然的 P:Z 对分别在小沟中保留了 N3 和 O2 原子。具体来说,在小沟中,X 呈 N3 和 O2 氢键受体,而 P 和 G 呈 N3 和氢键供体 N2 氨基。因此,X:K 的氢键能力与其他核碱基对的氢键能力不同。尽管如此,X:K 还是被忠实地复制了。(13, 14)
Helical Properties of Duplex DNA Containing X:K Pairs
含有 x:K 对的双链 DNA 的螺旋特性
使用 3DNA 分析 2X2K 结构的螺旋参数,该 3DNA 使用 El Hassan 和 Calladine 的方法 (27) 计算主要和次要沟宽以及其他碱基对参数 (28-30),并与 B 型 DNA 的主客体结构的其他参数进行比较,其中 X:K 被 G 取代:C、A:T 和 P:Z 位于相同位置,PDB ID 分别为 4XPE、4XPC 和 4XO0。(11) 用于比较的序列列于表 2 中。总体而言,2X2K 结构保持了 B 螺旋形式,平均螺旋扭曲为 34.9° ± 4.18°,相当于每圈 10.3 个碱基对。与 2X2K 结构相比,GC、AT 和 PZ 结构的平均螺旋扭曲为 34.7°,相当于每圈 10.4 个碱基对。因此,在 DNA 序列中掺入两个连续的 X:K 对不会显着扰乱 DNA 双链体的整体螺旋形式。X:K 碱基对步骤的螺旋扭曲变化与在相同碱基对位置的所有结构中观察到的变化相似。
表 2.用于分析的寡核苷酸
包括 2X2K、PZ、GC 和 AT 在内的所有四种结构都呈 B 型,但在小槽宽和大槽宽度上表现出一些差异。总体而言,2X2K 的大槽宽和短槽宽度类似于 GC 和 PZ 的宽(图 5 和表 3)。与含有 X:K 对的二核苷酸步骤相关的平均短沟宽和大沟宽分别为 12.3 Å 和 18.3 Å,这与 GC 结构中相应的二核苷酸阶限分别为 12.4 和 18.0 Å 以及 PZ 结构 12.5 和 18.7 Å 相似(表 3)。富含 AT 的序列具有较窄的小沟,正如我们的 AT 结构中观察到的那样,平均小沟宽度为 9.7 Å。2X2K 的小沟比 AT 结构的小沟宽 2.6 Å。另一方面,2X2K 的大槽比大槽宽度为 19.1 Å 的 AT 结构窄 0.8 Å。
Figure 5 图 5

Figure 5. Comparison of helical properties for host–guest complexes including X:K, G:C, A:T, and P:Z. The unique 8-mer DNA structure including X:K pairs (green) is shown superimposed in (A) with A:T (gray), (B) with G:C (blue), and (C) with P:Z (yellow). (D) The associated minor groove widths for the 16-mer DNA structures are shown in the same colors as designated in stuctures A–C.
图 5.主客体复合物(包括 X:K、G:C、A:T 和 P:Z)的螺旋特性比较。独特的 8 聚体 DNA 结构(包括 X:K 对(绿色)叠加在 (A) 与 A:T(灰色)、(B) 与 G:C(蓝色)和 (C) 与 P:Z(黄色)中叠加。(D) 16 聚体 DNA 结构的相关小沟宽度以与结构 A-C 中指定的颜色相同的颜色显示。
表 3.螺旋参数和局部碱基对参数:AT、GC、2X2K 和 PZ
local base pair parameters at position 6 位置 6 的局部碱基对参数 | ||||
X-K | P-Z | G-C | A-T | |
shear (Å) 剪切 (Å) | –0.44 | –0.87 | –1.40 | –0.22 |
stretch (Å) 伸展 (Å) | 0.08 | –0.42 | –0.47 | –0.34 |
stagger (Å) 交错 (Å) | 0.23 | –0.41 | –0.02 | 0.18 |
buckle (deg) 带扣 (DEG) | 6.19 | –11.91 | 5.38 | –1.40 |
propeller (deg) 螺旋桨 (DEG) | –10.61 | –6.69 | –5.60 | –15.89 |
opening (deg) 开口(度) | 6.64 | 2.96 | 12.60 | 8.06 |
local base pair parameters at position 7 位置 7 的局部碱基对参数 | ||||
X-K | P-Z | G-C | A-T | |
shear (Å) 剪切 (Å) | 0.08 | 0.84 | –0.68 | 0.39 |
stretch (Å) 伸展 (Å) | –0.07 | –0.25 | –0.66 | –0.21 |
stagger (Å) 交错 (Å) | 0.23 | 0.17 | 0.32 | 0.33 |
buckle (deg) 带扣 (DEG) | –3.09 | 0.05 | –0.45 | 3.23 |
propeller (deg) 螺旋桨 (DEG) | –19.41 | –10.05 | –12.64 | –17.58 |
opening (deg) 开口(度) | –8.10 | 0.30 | –4.85 | 5.93 |
Local base pair step parameters 本地碱基对步长参数 | ||||
XX/KK | PP/ZZ | GG/CC GG/CC 系列 | AA/TT AA/TT 系列 | |
shift (Å) 移位 (Å) | –2.03 | –0.93 | –1.62 | –0.29 |
slide (Å) 滑轨 (Å) | 0.84 | –0.02 | 0.99 | –0.22 |
rise (Å) 上升 (Å) | 3.43 | 3.03 | 3.49 | 3.13 |
tilt (deg) 倾斜(度) | –5.12 | –6.26 | –5.74 | –1.17 |
roll (deg) 卷(度) | –4.82 | 4.31 | –5.58 | –3.15 |
twist (deg) 扭曲(度) | 39.29 | 39.03 | 43.67 | 39.74 |
helical parameters 螺旋参数 | ||||
XX/KK | PP/ZZ | GG/CC GG/CC 系列 | AA/TT AA/TT 系列 | |
x-displacement (Å) x 位移 (Å) | 1.83 | –0.51 | 1.87 | 0.02 |
y-displacement (Å) Y 轴排量 (Å) | 2.35 | 0.68 | 1.58 | 0.30 |
helical-rise (Å) 螺旋上升 (Å) | 3.54 | 3.12 | 3.52 | 3.14 |
inclination (deg) 倾角 (deg) | –7.10 | 6.38 | –7.43 | –4.63 |
tip (deg) 尖端(度) | 7.53 | 9.27 | 7.64 | 1.71 |
helical-twist (deg) 螺旋扭曲 (deg) | 39.89 | 39.74 | 44.36 | 39.88 |
other parameters 其他参数 | ||||
X:K X:K | P:Z P:Z | G:C G:C | A:T 答:T | |
overall helical twist (deg) 整体螺旋扭曲 (deg) | 34.93 (4.18 SD) 34.93 (4.18 标清) | 34.69 (8.05 SD) 34.69 (8.05 标清) | 34.70 (7.19 SD) 34.70 (7.19 标清) | 34.70 (3.49 SD) 34.70 (3.49 标清) |
averagea minor groove width (Å) 平均小沟宽度 (Å) | 12.3 | 12.5 | 12.4 | 9.7 |
averagea major groove width (Å) 平均大槽宽度 (Å) | 18.3 | 18.7 | 18.0 | 19.1 |
Average values obtained for dinucleotide steps 5–7 containing X:K, Z:P, G:C, or A:T, respectively.
分别包含 X:K、Z:P、G:C 或 A:T 的二核苷酸步骤 5-7 获得的平均值。
其他螺旋参数(包括 x 位移、y 位移、螺旋上升、倾角和尖端)与表 3 所示的 GC 结构相似。X:K 碱基对的螺旋扭曲角也位于 B 型 DNA 通常报道的范围内,其中 X:K 的螺旋扭曲为 39.89°(B 型 DNA 的螺旋扭曲值在 27.9° 至 40° 之间)。就局部螺旋构象而言,(31-34)X:K 对比 P:Z 对更接近 G:C 对。GC 和 2X2K 之间螺旋参数值的微小变化是结构上序列依赖性影响的结果。
Local Properties of the X:K Nucleobase Pair
X:K 核碱基对的局部性质
使用 3DNA 分析 X:K 对的局部碱基对参数、局部碱基对步骤参数和沟宽(表 3)。在比较 X:K 与 P:Z、G:C 和 A:T 的局部碱基对参数时,位置 6 和 7(编号方案参见图 1)的屈曲值分别为 6.19° 和 −3.09°,与 G:C 值 5.38° 和 −0.45° 相似,但与 P:Z 的 −11.91° 和 0.05° 的相似度较低(表 3).剪切、交错和开口值位于其他碱基对的观测范围内,而位置 6 和 7 的 X:K 对的 0.08 和 −0.07 Å 拉伸值在幅度上小于其他碱基对的观测值。
X:K 碱基对不是平面的,位置 6 和 7 的螺旋桨扭转角分别为 -10.61° 和 -19.41°,比 G:C(-5.6° 和 -12.64°)或 P:Z(-6.69° 和 -10.05°)更接近 A:T(-15.98° 和 -17.58°)观察到的扭曲角(图 6A 和表 3)).A:T 对中的重要螺旋桨角通常归因于该对中只有两个氢键的事实。然而,具有三个氢键的 X:K 对中的这一特征表明,它可能是碱基对本身的固有特性,不取决于氢键的数量。X:K 和 A:T 对的堆叠交互在表面上相似,如图 6 B 所示。
Figure 6 图 6

Figure 6. Comparison of local base pair properties of X:K and A:T. (A) Cartoon/stick renderings for X:K and A:T pairs (7th nucleotide step, X7:K10 as shown in Figure 3) with a semitransparent gray molecular surface superimposed show significant propeller twist angles for the base plane of X or A vs K or T. A similar rendering is shown for a relatively planar G:C base pair (6th nucleotide step G6:C11). (B) Stacking of XX/KK and AA/TT shown as stick renderings are overall similar in accommodating the nucleobase pairs with significant propeller twist angles.
图 6.X:K 和 A:T 的局部碱基对特性的比较。(a) X:K 和 A:T 对的卡通/棒状渲染(第 7 个核苷酸步骤,X7:K10,如图 3 所示)与半透明灰色分子表面叠加显示 X 或 A 与 K 或 T 的基平面有明显的螺旋桨扭曲角。对于相对平面的 G:C 碱基对(第 6 个核苷酸步骤 G6:C11),显示了类似的渲染。(B) 以棒状渲染显示的 XX/KK 和 AA/TT 的堆叠在容纳具有显着螺旋桨扭转角的核碱基对方面总体上相似。
因此,考虑 X:K、A:T、G:C 和 P:Z 对的静电势表面 (ESP)、偶极子和氢键能是很有趣的。ESP 近似于短程电子环境,而偶极子描述长程电子效应和氢键能,即 Watson-Crick 对的紧密性。ESP 直观地显示 X:K 和 A:T 中存在不同的氢键机会(图 7)。在 ESP 映射中,我们还显示了电偶极矩。X:K 的电偶极矩与 A:T 在大小和方向上都非常不同。X:K 对的电偶极矩相对于 A:T 旋转 ∼90 度。此外,A:T 偶极子为 2.1 D,而 X:K 中的偶极子仅为 1.3 D。A:T 的 Watson-Crick 氢键能比 X:K 大 3.6 kcal/mol(表 4)。因此,X:K 中三个氢键在能量上的贡献比 A:T 中两个氢键的贡献弱。A:T 电子结合能的估计值与之前所做的计算相匹配。(35) 形成 X:K 对的吉布斯能量在 -1.9 kcal/mol 时几乎为零。请注意,这只能告诉我们氢键对能量的贡献是什么,以前的研究表明,碱基对堆叠分散相互作用在数值上对总吉布斯能量的意义更大。 (36) Watson-Crick 氢键自由能利用 CCSD(T) (37-39) /aug“-cc-pVTZ 作为电子能,这已被证明精确到单参考波函数的真实气相能量的 ∼1 kcal/mol;熵贡献基于 M06-2X/aug“-cc-pVTZ 分区函数。总体观点很清楚,每个氢键的 X:K 氢键能明显弱于 A:T,因此 X:K 对双链体稳定性的净贡献略小于 A:T 对的净贡献,尽管它有三个氢键。这些计算结果与为包括 X:K 对在内的寡核苷酸测定的较低实验熔解温度一致(SI,表 S1)。
Figure 7 图 7

Figure 7. Dipole moments and electrostatic potential maps (ESPs) for (A) X:K, (B) A:T, (C) G:C, (D) P:Z nucleobase pairs. Methyl substituents are used in place of the C1′ carbon in the deoxyribose ring. The ESP color gradation is such that red is ca. −40 kcal/mol and blue is ca. +40 kcal/mol; strict energetic interpretation is limited to indications of broad differences in reactivity. Dipole moments are shown as a blue arrow, following the convention that a positive vector points toward a positive charge density. The magnitude of the vectors is not proportional to length (length modified for ease of view).
图 7.(A) X:K、(B) A:T、(C) G:C、(D) P:Z 核碱基对的偶极矩和静电势图 (ESP)。使用甲基取代基代替脱氧核糖环中的 C1' 碳。ESP 色阶是这样的,红色约为 −40 kcal/mol,蓝色约为 +40 kcal/mol;严格的能量解释仅限于反应性差异的广泛指征。偶极矩显示为蓝色箭头,遵循正矢量指向正电荷密度的约定。矢量的大小与长度不成比例(为便于查看,修改了长度)。
表 4.X:K 和 A:T 核碱基对的 Watson-Crick 氢键对氢键能量贡献 (kcal/mol)
X:K X:K | A:T 答:T | Δ | |
ΔU (electronic) ΔU (电子式) | –15.2 | –16.1 | +0.9 |
ΔH | –13.8 | –13.1 | –0.7 |
–TΔS | 11.9 | 7.6 | +4.3 |
ΔG | –1.9 | –5.5 | +3.6 |
值得注意的是,在 X:K 对的计算结构中,X 的 N1 上的质子显然转移到了 K 的 N3 上。这种转移似乎产生了 Jorgensen 和 Pranata 提出的最有利的次级相互作用安排。(40) 在他们的分析中,部分正电荷和负电荷形成三个氢键的对称模式是最不利的安排。这是图 1 中 X:K 描述的氢键排列。或者,X 中 N1 的去质子化和 K 中 N3 的质子化产生最有利的二次排列,如图 8 所示,三个部分正电荷与 K 相关,三个部分负电荷与 X 相关,以及计算出的电子密度支持质子的这种排列。或者,可以说内能酸-碱转移的能量(假设 K8 的 pKa 值为 ∼6.7,X 的 pKa 值为 8.5,图 S1)是以牺牲形成的放能氢键为代价的。这有助于我们理解为什么三个氢键不比两个好:我们只是以牺牲质子转移为代价来实现这一点。
Figure 8 图 8

Figure 8. Calculated X:K pair has a proton transfer. (A) The chemical structure is shown for the calculated X:K pair with bond distances in the vicinity of the hydrogen bonding pairs. Bond lengths (Å) of key species for Watson–Crick binding of X:K. All calculations are based on M06-2X/aug″-cc-pVDZ geometries, expected to be accurate to within 0.03 Å. Note the proton transfer from X to K, as shown by the bond lengths. (B) The calculated electron density is shown for the X:K pair and clearly shows that the proton involved in the central hydrogen bonding pair is associated with N3 of K and not N1 of X. Electron density contours given at 0.04 electron charge/Bohr3 from the KS-DFT density matrix.
图 8.计算出的 X:K 对具有质子转移。(A) 显示了计算的 X:K 对的化学结构,键距离在氢键对附近。X:K 的 Watson-Crick 结合关键物质的键长 (Å)。所有计算均基于 M06-2X/aug“-cc-pVDZ 几何结构,预计精度在 0.03 Å 以内。请注意从 X 到 K 的质子转移,如键长所示。(B) 计算出的电子密度显示了 X:K 对,并清楚地表明参与中心氢键对的质子与 K 的 N3 相关,而不是 X 的 N1。KS-DFT 密度矩阵中给出的电子密度等值线为 0.04 个电子电荷/玻尔3。
人们可能会对计算声明持怀疑态度,即酸碱转移是形成 Watson-Crick 对所必需的。然而,这一发现与气相 DFT 计算无关。如果使用隐式溶剂模型(Cramer 和 Truhlar 的 SMD 模型 SMD)来表示具有相同 DFT 方案的水性溶剂,则还会观察到质子转移(与 K 氮的氢键距离为 1.05 Å,与 X 氮的氢键距离为 1.79 Å)。同样,如果使用没有经验参数(如 MP2(也称为 MBPT(2)的从头计算,则会观察到相同的特征(1.09 Å 到 K 氮,1.62 Å 到 X 氮)。
X:K 中的氢键比 A:T 中的氢键弱这一事实可能有助于观察到螺旋桨的倾向。如上所述,每个 X:K 对都包含一个长度超过 3.0 Å 的氢键。对于位置 6,O2-N2、N1-N3 和 O6-N4 氢键距离分别为 2.64、2.98 和 3.18 Å;对于位置 7,O2–N2、N1–N3 和 O6–N4 分别为 3.28、2.98 和 2.69 Å(原子数见图 1,位置数见图 3)。因此,对于位置 6,长氢键是 O6-N4 键,而对于位置 7,它是 O2-N2 键。这一发现与一般较弱的理论氢键、较大的螺旋桨角度以及屈曲可能也有助于的结果一致。位置 6 的 X:K 对的弯曲角为 6.2°,螺旋桨角为 −10.6°,而位置 7 的弯曲方向相反,弯曲角为 -3.1°,螺旋桨角为 −19.4°。同样,A:T 对在位置 6 和 7 有一个长氢键(编号如图 3 所示),在本例中是相同的键,分别为 N6-O4、3.08 和 3.13 Å。A:T 对都有大螺旋桨角,分别为 -15.9 和 -17.6°,带小扣角,分别为 -1.4° 和 3.2°。
另一方面,N2-O2、N1-N3 和 O6-N4 在 6 位的 P:Z 氢键距离分别为 2.57、2.79 和 2.94 Å,7 位 P:Z 的值分别为 2.63、2.80 和 2.90 Å。(11) 这一发现与报道的 P:Z (41) 比 G:C 或 A:T 更强的理论氢键一致。(42) 最后,位置 6 的 G:C 对在位置 6 处表现出一个长氢键,O6–N4 距离为 3.37 Å,这可能是由于 −1.4 Å 的剪切、5.4° 的屈曲和 12.6° 的开口的组合。对于位置 7,所有三个氢键均为 2.71 Å。因此,在没有大剪切效应的情况下,G:C 氢键相互作用都小于 3.0 Å。两个 P:Z 对在位置 6 和 7 也分别被 −0.87 和 0.84 Å 剪切,但保持正常的氢键距离。
与 2X2K 结构与其他 B 型 DNA 结构(G:C、A:T 和 P:Z)的其他局部碱基对步骤参数的比较,包括每个核苷酸的轴向上升(B-DNA 值范围在 3.03 Å 至 3.37 Å 之间)和碱基对倾斜(B-DNA 值范围在 -5.9° 至 -16.4°之间),(31-34) 表明 2X2K 的上升和倾斜值位于同一范围内。XX/KK 二核苷酸阶梯基座的上升和倾斜为 3.43 Å 和 −5.12°。磷酸盐-磷酸盐 (P-P) 距离也与标准 B 型 DNA 的偏差很小。B-DNA 的 P-P 距离约为 7 Å,而 XX 和 KK 的 P-P 距离分别为 6.5 和 6.3 Å。(34) 所有残基的气角都属于 B 型 DNA 中的反构象。我们的结果表明,2X2K 结构类似于 B 型 DNA,特别是富含 G:C 碱基对的 B 型 DNA 序列。
The Bigger Picture. Why Terran DNA Uses the Standard Nucleobase Pairs
更大的图景。为什么 Terran DNA 使用标准核碱基对
随着与 AEGIS 对相关的实验工作的发展,我们了解到具有非标准氢键排列的对能够稳健地支持双相结构。这包括存在多个连续非标准对的链之间的双工。对于配对原理仅基于疏水相互作用或尺寸互补性、缺乏碱基间氢键的对,情况并非如此。一个例子是 Romesberg 的非标准碱基 d5SICS 和 dNaM,它们通过疏水和几何互补性配对,并通过嵌入模式堆叠,而不是在双链 DNA 中边缘堆叠。(16, 43)另一个是 7-(2-噻吩基)咪唑[4,5-b]吡啶 (Ds) 和 2-硝基-4-丙炔基吡咯 (Px) 之间的 Hirao 疏水性非自然碱基对系统。(44, 45)Hirao 的疏水性核碱基 Ds:Px 在 PCR 反应中成功扩增;Klentaq 的三元复合物的晶体结构掺入 dPxTP 与 Ds 相反,表明疏水对也可以作为 DNA 聚合酶掺入的有希望的候选者。(46) 然而,这些研究并未描述多个疏水碱基对对 DNA 双链体整体结构的影响。模板 dD 与 Thr664 的侧链氧原子的冲突、三元结构中更灵活的拇指结构域以及缺乏包含这些疏水核苷酸的二元结构表明,在将疏水碱基对用于扩展遗传字母表之前,需要对疏水碱基对进行更多研究。(46)
迄今为止,存在的绝大多数非标准核碱基的功能和结构数据主要集中在 DNA 双链体中单个非天然碱基对的掺入。了解在双链 DNA 中掺入多个非标准碱基对的效果非常重要,它不会显著扭曲 DNA 的整体结构,并且还为它们在多轮复制后保留在双链 DNA 中提供了基础。因此,X:K 对满足了合成生物学的目标,即开发扩展的遗传系统,保留天然核碱基的理想特性,包括完全进化性。
然而,这些观察结果也提出了一个问题,即为什么天然 DNA 使用它的核碱基。例如,我们很难理解为什么腺嘌呤只向其胸腺嘧啶互补体提供两个氢键单元,而高级生物技术专家必须努力在包含“弱”核碱基对和“强”核碱基对的系统中获得均匀的杂交和引发。为什么不使用 2-氨基腺嘌呤(二氨基嘌呤)代替腺嘌呤,并获得一对由三个经典氢键连接的氢键呢?
在达尔文模型下,如果不假设替代系统可以通过随机变异获得,就不能谈论遗传系统的“优化”。事实上,已知一些病毒在其 DNA 中使用 2-氨基腺嘌呤,这表明这种替代品实际上在其自然历史中可供地球生命使用。(47) 鉴于此,人们可能会将 2-氨基腺嘌呤和胸苷之间出奇的弱对解释,尤其是在 DNA 中与 RNA 相比,(48) 作为 Watson-Crick 配对中对称性缺点的第二个例子。这个缺点也存在于类似对称的 X:K 对中。
Conclusion 结论
总之,与 X:K 对相关的感兴趣特性包括出现在大沟和小沟中的独特氢键供体和受体模式,这与 A:T、G:C 或 P:Z 不同。正如我们观察到的 P:Z,包括两个连续的 X:K 碱基对和四个 X:自互补的 16 聚体寡核苷酸中的总 K 对很容易适应我们的宿主-客体系统的 B 型 DNA 中。B 型 DNA 中必须包含任何人工成分,因为这是基因组 DNA 在细胞中最常见的形式。与二核苷酸步骤相关的序列特异性特性与它们在寡核苷酸中的位置无关(不包括与蛋白质相互作用所涉及的三个末端碱基对)先前已在 CA 二核苷酸整合酶加工位点的宿主-客体研究中得到证明。(24) 因此,已经审查了主客体系统,用于分析序列特异性效应,而没有可能影响寡核苷酸结构性质的不同晶格约束。
在这项研究中,我们分析了位置 6 和 7 的二核苷酸碱基对步骤的结构特性,包括 X:K、P:Z、G:C 或 A:T。在结构上,X:K 对表现出与 A:T 对相似的螺旋桨角度,而扣值和其他碱基对参数值与 G 相似:C 处于同一位置。X:K 对表现出显着螺旋桨扭曲角的倾向得到了 X:K 的熔化温度数据和氢键能计算的支持,X:K 实际上比 A:T 弱。这些计算支持由去质子化 X 和质子化 K 组成的氢键对 X:K。总体而言,2X2K 的螺旋特性为 B 型,与 G:C 和 P:Z 最相似,大槽和小槽宽度与 G:C 相似。
因此,大肠杆菌 DNA 聚合酶 I 无法掺入两个连续的 X:K 对并不是由于连续的 X:K 对导致双链体 DNA 的显著扭曲造成的。相反,它更可能是由核碱基的化学性质引起的,例如 K 中缺乏氢键受体;已知 DNA 聚合酶通过特定的氢键相互作用“读取”小沟。(25, 26)这对于使用 X:K 扩展基因组来说并不是一个显着的限制,因为它支持将其用作单个对。总之,我们得出结论,包含 X:K 对提供了独特的特性,同时仍然保持与生物学相关形式的 DNA 的兼容性,因此有可能扩展遗传字母表。
Methods 方法
Synthesis and Purification of KX Containing Oligonucleotides
含 KX 的寡核苷酸的合成和纯化
使用使用其他地方描述的程序合成的 dX 和 dK 亚磷酰胺,通过固相合成制备含 AEGIS 的寡核苷酸。这些亚磷酰胺现在可通过 Firebird Biomolecular Sciences, LLC(www.firebirdbio.com,佛罗里达州阿拉楚阿)获得。GACTKX“六个字母”DNA 分子 5'-CTTATXXTAKKATAAG-3' (2X2K) 和 5'-CTTATXXXKKATAAG-3' (3K3X) 是在内部制备的,如下所述。此处使用的其余序列购自 IDT(爱荷华州克拉尔维尔)。
实验表明,在标准条件(氢氧化铵,55 °C,过夜)下处理 GACTKX DNA 寡核苷酸后,其脱保护导致 dX 杂环大量分解。因此,A、G、C 和 K 外环胺分别以苯氧乙酰基、苯氧基乙酰基、乙酰基和异丁酰基的形式受到保护。然后,在 55 °C 下使用 50 mM K2CO3 的 MeOH 溶液去除本研究中使用的所有 GACTKX 寡核苷酸过夜。然后通过 HPLC 纯化它们。
Circular Dichroism Analyses
圆二色性 (CD) 研究用于评估寡核苷酸双链体在中性 pH 值和低盐浓度缓冲的水溶液中的螺旋形式。分析的自配对 DNA 序列包括 2X2K (5'-CTTATXXTAKKATAAG-3')、3X3K (5'-CTTATXXXKKKATAAG-3')、具有 A:T 对的相应序列 (5'-CTTATAAATTTATAAG-3') 和具有 G:C 对的相应序列 (5'-CTTATGGGCCCATAAG-3')。
对于 CD 分析,用含有 10 mM HEPES pH 7.0 和 10 mM MgCl2 的缓冲液将这些 DNA 序列的储备液 (2.5 mM) 稀释至 5 μM。DNA 序列的 CD 光谱在 Jasco J-810 CD 仪器上以 25 °C 的温度、50 nm/min 的速率和 0.1 nm 的波长增量收集。记录 320-220 nm 波长的 DNA 序列的椭圆度 Ø (mdegrees)。最终谱图是针对缓冲液(10 mM HEPES pH 7.0,10 mM MgCl2)自身获得的椭圆度读数进行校正的五次扫描的平均值。最初测量 GC 和 AT 对照序列的谱图,随后测量 2X2K 和 3X3K 序列的谱图。
Crystallization and Data Collection
将含有 2 对或 3 对 X:K(2X2K 或 3X3K)的自互补 16 聚体 DNA 寡核苷酸重悬于含有 10 mM HEPES (pH 7.0) 和 10 mM MgCl2 的缓冲液中,然后加热至 70 °C 进行退火,然后缓慢冷却至室温,得到最终浓度为 2.5 mM 的双链体 DNA。分两步将蛋白质(包括 Moloney 鼠白血病病毒逆转录酶 MMLV RT 残基 24-278 的 N 末端片段)稀释至 0.65 mM 的浓度。使用 50 mM MES (pH 6.0) 和 0.3 M NaCl 将 2.9 mM 蛋白质储备液稀释至 1.4 mM。然后将该 1.4 mM 亚储备液在 100 mM HEPES (pH 7.5) 和 0.3 M NaCl 中进一步稀释至 0.65 mM。将宿主–2X2K 或宿主–3X3K(蛋白质–DNA)复合物分别以 1:2 的比例(0.43 mM 蛋白质/0.86 mM DNA)设置在含有 100 mM HEPES (pH 7.5)、0.3 M NaCl 的缓冲液中,并在 4 °C 下孵育 1 小时。
使用宿主-GC 的自成核蛋白质-DNA 晶体作为种子,用含有 KX 的寡核苷酸结晶宿主蛋白质。与 GC 复合物结合的宿主蛋白晶体在含有 1 μL 蛋白质-DNA 复合物和 1 μL 含有 10% PEG 4000、5 mM 乙酸镁和 50 mM ADA (pH 6.5) 的溶液的悬滴中生长。储液槽溶液由 500 μL 10% PEG 4000、5 mM 乙酸镁和 50 mM ADA (pH 6.5) 组成。宿主–2X2K 微晶种晶体在 8% PEG 4000、5 mM 乙酸镁和 50 mM ADA (pH 6.5) 下生长。没有获得 3X3K 复合物的主客体晶体。仅 DNA 的 3X3K 晶体没有衍射到高分辨率,因此没有被进一步追求。在 9% PEG 4000、5 mM 乙酸镁、100 mM HEPES (pH 7.5) 和 20% 乙二醇中冷冻保护宿主–2X2K 晶体,然后在液氮中快速冷冻以进行数据收集。
在伊利诺伊州达里恩阿贡国家实验室高级光子源的 SBC-19-BM 光束线上以 1.75 Å 的分辨率收集 2X2K 主客体复合物数据。数据缩减在空间群 P2121 2中进行,并使用 HKL3000对数据进行索引、整合和缩放。(49) 使用 PDB ID 4XO0 的蛋白质模型,使用 CCP4 程序 MOLREP (50) 通过分子置换来确定主客体晶体结构。(11) 单独使用蛋白质模型进行定相为宿主客体复合物中的 DNA 提供了无偏电子密度。在 COOT (51) 中对蛋白质模型的调整和水分子的添加,最初在 REFMAC 中精制。(52)
为了构建 DNA,最初构建 3 个碱基对,然后在 REFMAC 中精炼以提高下一个连续碱基对的电子密度。蛋白质-DNA 精制之后,再添加两个碱基对并在 REFMAC 中精制。KX 的参数和链接文件是在 PHENIX 中创建的。(53) 最后,添加了最后三个碱基对,包括 Ks 和 Xs,并使用 PHENIX 进行了细化。在 COOT 中进行多轮模型调整,在 PHENIX 中进行细化,R-work 和 R-free 值分别为 20.86% 和 23.85%。PDB 的坐标已存入 2X2K(表 1),PDB 标识符为 5VBS。
Quantum Mechanical Calculations
在 Gaussian 09 软件中使用 M06-2X (54)/aug“-cc-pVTZ (55) 优化了 X:K、P:Z、G:C 和 A:T 对的结构。(56) 在每个结构中,2'-脱氧核糖由甲基建模以表示周围的电子环境。单素数符号是指在所有重原子(不是氢)上使用 aug′-cc-pVTZ;使用双素数表明没有对氢原子或碳原子使用漫反射函数。选择这种方法是因为芳香环上具有如此多的扩散函数存在线性依赖性,这表明它们的缺失有助于 SCF 收敛,而不会损失基表示。
当 RMS 力在所有几何参数上不大于 1.0 × 10-4 Hartree/Bohr 并且没有单个几何参数的力大于 3.3 × 10-4 Hartree/Bohr 时,结构被认为是“优化的”。KS-DFT (57, 58) Lebedev 积分网格使用了 99 个径向点和 590 个立体角点。当 SCF 矩阵元素的变化小于 10-6 时,SCF 被认为是“收敛的”。在本文中,所有基集都使用了球形 d 函数。所有静电势图的构建都使用 KS 行列式密度,等值线为每立方玻尔 0.001 基本电荷。选择 M06-2X 泛函是因为其在计算有机分子能量、几何形状和色散现象方面的强大性能,尽管它是凭经验参数化的。计算的所有偶极矩均基于此 SCF 参考。
Watson-Crick 氢键自由能利用 CCSD(T) (37-39)/aug′-cc-pVDZ 的复合方法描述电子能,该方法已被证明精确到单参考波函数的真实气相能量的 ∼1 kcal/mol。(59) 基集外推使用 Helgaker (36) 方案进行 aug“-cc-pVTZ 和 aug”-cc-pVQZ 外推。当耦合簇能量方程张量幅度变化小于 10-6 时,耦合簇方程被认为是“收敛的”。所有耦合的集群和 MP2 计算都使用 ACES3 软件 (60),因为它能够并行处理数千个处理器。所有计算均在印第安纳大学的 Big Red II 超级计算机上进行。熵对自由能的贡献使用了基于 M06-2X/aug“-cc-pVTZ 优化的振动分配函数。Watson-Crick 氢键能在这里定义为相互作用对(比如 PZ)与孤片段之间的差值,每个片段都单独优化(在本例中分别为 P 和 Z)。
Supporting Information 支持信息
The Supporting Information is available free of charge on the ACS Publications website at DOI: 10.1021/acssynbio.7b00150.
支持信息可在 ACS Publications 网站上免费获取,网址为 DOI:10.1021/acssynbio.7b00150。
Figure S1. UV absorbance as a function of pH for the dX nucleoside gives pKa of 8.5 ± 0.1. Table S1. Melting point temperatures for oligonucleotides containing X:K pairs Coordinates of M06-2X/aug″-cc-pVDZ optimized structures, Å (PDF)
图 S1.dX 核苷的紫外吸光度与 pH 值的函数关系,得到 pKa 为 8.5 ± 0.1。表 S1.含有 X:K 对的寡核苷酸的熔点温度 M06-2X/aug“-cc-pVDZ 优化结构的坐标,Å (PDF)
Acknowledgment 确认
单击以复制部分链接Section link copied!
Results shown in this report are derived from work performed at Argonne National Laboratory, Structural Biology Center at the Advanced Photon Source. Argonne is operated by UChicago Argonne, LLC, for the U.S. Department of Energy, Office of Biological and Environmental Research under Contract DE-AC02-06CH11357. Calculations were performed on the Indiana University Big Red 2 supercomputer. The authors thank the Lilly Endowment, Inc. for support of the Indiana University Pervasive Technology Institute and the Indiana METACyt Initiative. The material is based in part upon work supported by NASA under awards NNX14AK37G and NNX15AF46G. Any opinions, findings, and conclusions or recommendations expressed in this material are those of the author(s) and do not necessarily reflect the views of the National Aeronautics and Space Administration. Research reported in this publication was supported by the National Institute of General Medical Sciences of the National Institutes of Health under Award Number R01GM111386. The content is solely the responsibility of the authors and does not necessarily represent the official views of the NIH. This material is also based in part upon work supported by the National Science Foundation under Grant No. CHE 1507816.
本报告中显示的结果来自阿贡国家实验室结构生物学中心在先进光子源进行的工作。Argonne 由 UChicago Argonne, LLC 为美国能源部生物与环境研究办公室运营,合同编号为 DE-AC02-06CH11357。在印第安纳大学 Big Red 2 超级计算机上执行计算。作者感谢 Lilly Endowment, Inc. 对印第安纳大学普适技术研究所和印第安纳州 METACyt 倡议的支持。该材料部分基于 NASA 在 NNX14AK37G 和 NNX15AF46G 奖项下支持的工作。本材料中表达的任何意见、发现、结论或建议均为作者的观点,并不一定反映美国国家航空航天局的观点。本出版物中报告的研究得到了美国国立卫生研究院国家普通医学科学研究所的支持,奖项编号为 R01GM111386。内容完全由作者负责,并不一定代表 NIH 的官方观点。本材料还部分基于美国国家科学基金会 (National Science Foundation) 在 Grant No.CHE 1507816。
References

Supporting Information
