2 蛋白质的组成和结构(共43页) - 图文

更新时间:2024-01-17 09:48:01 阅读量: 教育文库 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

第二章 蛋白质的组成和结构(第六版)

人胰岛素晶体。胰岛素是蛋白激素,是人体维持适当血糖浓度的关键。多肽链的氨基酸序列(一级结构)决定了蛋白质的性质。胰岛素两条多肽链折叠形成单一胰岛素分子的三级结构。六个胰岛素分子之间相互作用形成复合物。这种复合物结构,即胰岛素分子之间的相互作用叫蛋白质四级结构。在适当条件诱导下,胰岛素复合物能形成晶体。蛋白质晶体可以用来进行蛋白质结构测定。

生物体内蛋白质的功能多样,它们在所有的生物过程中起关键作用。蛋白质能充当生物催化剂(酶),能储存、运输其它分子如氧气,能给生物体提供机械支持力和免疫力,能产生运动、发射神经冲动、控制生物体的生长与发育。实际上,本书大部分内容集中讨论蛋白质能执行哪些功能,以及蛋白质执行这些功能的分子机理。

蛋白质具备几个关键性质使蛋白质能够执行各种各样的生物功能。

1. 蛋白质是肽键连接氨基酸的线性聚合物。蛋白质能自动折叠成三维结构,而且蛋白质的三

维结构取决于蛋白质的氨基酸序列。蛋白质的功能直接依赖于蛋白质的三维结构(图2.1)。因此,蛋白质是一维的分子序列向三维的分子功能转化的具体体现。

2. 蛋白质有很多功能基团。这些功能基团包括醇羟基、巯基、巯醚基、羧基、酰胺基、和不

同的碱性基团。大多数基团有化学反应性。氨基酸序列不同,其功能基团的组合就不同,这解释了不同蛋白质执行不同功能的原因。功能基团的化学反应性是酶催化活性必需的(见第8至第10章)。

3. 蛋白质分子之间或者蛋白质与其它分子之间能相互作用形成复合物。复合物的蛋白质组分

协同作用能够执行单一组分无法完成的功能(图2.2)。例如大分子复合物执行DNA复制、细胞内信号传递、以及其它必需的生物过程。

4. 有些蛋白质很坚硬,但有些蛋白质很柔软。坚硬的蛋白质可以作为细胞骨架或粘联组织的

结构元件。而有一定柔软度的蛋白质可以充当绞合部(hinges),弹簧(springs),或杠杆(levers)。这些绞合部(hinges)、弹簧(springs)、或杠杆(levers)对有些蛋白质的功能、蛋白质之间的相互作用或蛋白质与其它成分相互作用形成复合物、或者在细胞内或细胞间传递信息是必需的。

图2.1 结构决定功能。DNA复制机器的一个蛋白组分围绕DNA双螺旋的一个区域(圆柱形)。含有两个完全相同亚基的蛋白质(分别用红色和黄色表示)像一把夹子夹住复制DNA,使复制DNA不会与复制机器解离。

图2.2 蛋白质复合物。昆虫飞行组织切片的电子显微镜图谱,其中两种蛋白质纤维呈六边形排列[Courtesy of Dr. Michael Reedy]。

图2.3 柔软性与功能。乳转铁蛋白与铁离子结合后发生构象变化,使其它分子能够区分铁离子结合型和游离型乳转铁蛋白。[自1LFH.pdb和1LFG.pdb描绘]

2.1 蛋白质的氨基酸组分有20种

氨基酸是蛋白质的组分。??氨基酸有一个中心碳原子,即??碳原子,它与一个氨基、一个羧基、一个氢原子、和一个独特的R基团连接。通常将R基团称为侧链。如果碳原子所连接的四个基团各不相同,这个碳原子就是手性碳原子。手性碳原子有两种构型,即L-型和D-型(图2.4)。

图2.4 氨基酸的L-型和D-型异构体。字母R表示侧链。L-型和D-型之间互为镜像。

蛋白质的氨基酸组分都是L-型,没有D-型。几乎所有的氨基酸的L-型异构体,其绝对构型是S-型而不是R-型(图2.5)。人们花了很大的精力研究蛋白质氨基酸采用L-型的原因,但至今没有令人满意的解释。尽管选择L-型看上去有些主观,但是在进化早期一旦选定就固定下来,导致今天的蛋白质氨基酸组分仍然是L-型。

图2.5 蛋白质的氨基酸组分只有L-型。几乎所有L-型氨基酸的绝对构型是S型,即从最高优先权替代基团至最低优先权替代基团呈逆时针时表明该手性碳原子是S-构型。

中性pH溶液中氨基酸主要是双极性离子解离型(也称为两性离子)。此时,氨基质子化成铵离子(-NH4+),羧基脱质子成羧酸根离子(-COO?)。氨基酸的解离状态受溶液pH值影响(图2.6)。在酸性溶液中(如pH 1),氨基酸的氨基质子化(-NH4+),但羧基不解离(-COOH)。随着pH值增加,羧酸基团丢失质子变成-COO?(因为羧基的pKa值接近2)。双极性离子状态持续到pH值至9。pH值超过9导致铵离子丢失质子。

图2.6 pH值控制离子化状态。改变溶液pH值能改变氨基酸的解离状态。中性pH溶液的氨基酸呈两性离子。

20种氨基酸的侧链R各不相同,其差异表现在侧链的大小、形状、电荷、氢键形成能力、疏水性、和化学反应性。实际上所有生物的蛋白质都由这20种氨基酸组成,只有几个例外。这种方式组成蛋白质已经有几十亿年了。蛋白质能够执行不同功能来自于蛋白质组分氨基酸的多样性。研究氨基酸如何构建成能够执行特定功能蛋白质的三维结构是生物化学令人兴奋的研究领域,我们在2.6节将讨论这个问题。

现在我们来看看这20种氨基酸。最简单的氨基酸是甘氨酸,其侧链就是氢原子。有两个氢原子与??碳原子结合,因此甘氨酸是唯一的一个非手性氨基酸(即对称氨基酸)。第二个简单氨基酸是丙氨酸,其侧链是甲基(-CH3)(图2.7)。

图2.7 甘氨酸和丙氨酸的结构。上面的球棒模型表示原子间化学键的空间排列。中间的立体化学结构式表示与??碳原子连接的化学键和基团的几何排布。底部是Fischer投影式。

更大脂肪侧链的氨基酸有颉氨酸、亮氨酸、异亮氨酸和甲硫氨酸(图2.8)。甲硫氨酸侧链是含有硫醚的脂肪链。异亮氨酸含有另一个不对称碳原子,图2.8仅画出了天然氨基酸的构型。脂肪侧链较大的氨基酸是疏水的氨基酸,它们在水中将簇合而不与水接触。水溶性蛋白质三维结构的稳定性来自于蛋白质疏水氨基酸侧链簇合,即疏水效应。不同大小和不同形状的脂肪侧链簇合很紧,相互间的空隙很小。脯氨酸侧链也是一个脂肪侧链,但脯氨酸侧链既与??碳原子结合又与??氨基的N-原子结合(图2.9)。由于侧链环状结构的限制,脯氨酸能够显著影响蛋白质空间结构。

图2.8 侧链是烷基的氨基酸。用*号标出了异亮氨酸的另一个手性碳原子。

图2.9 脯氨酸的环状结构。氨基酸的侧链既与??碳原子结合又与??氨基N-原子结合。

有三个氨基酸的侧链有芳香环(图2.10)。苯丙氨酸是苯环替代丙氨酸的一个氢原子。酪氨酸的芳香环有一个羟基。与其他氨基酸侧链呈化学惰性相比,酪氨酸的羟基有化学反应性。色氨酸的吲哚基团替代丙氨酸侧链的氢原子。吲哚基团有的两个环融合在一起,一个环有NH基团。苯丙氨酸是疏水氨基酸,但是酪氨酸和色氨酸疏水性弱,因为它们的侧链有羟基或NH基。

图2.10 侧链有芳香基团的氨基酸。苯丙氨酸、酪氨酸和色氨酸有疏水性,但是色氨酸和酪氨酸也有亲水性,因为它们的侧链有-NH基团或-OH基团。

有5种氨基酸的侧链有极性但不带电荷。其中两个氨基酸侧链有羟基与脂肪链相连(图2.11)。丝氨酸是结合一个羟基的丙氨酸衍生物,而苏氨酸类似于颉氨酸,但用羟基替代了颉氨酸的一个甲基。羟基的存在使苏氨酸和丝氨酸亲水,其反应活性比丙氨酸和颉氨酸大得多。与异亮氨酸一样,苏氨酸也有第二个不对称碳原子,但蛋白质的苏氨酸只有一种构型。

图2.11 含有脂肪羟基的氨基酸。丝氨酸和苏氨酸侧链的羟基使这两种氨基酸亲水。苏氨酸的另一个不对称碳原子用*标出。

谷氨酰胺和天冬酰胺的侧链也是极性但不带电荷。这两种氨基酸侧链的末端是酰胺而不是羧酸(图2.12)。谷氨酰胺的侧链比天冬酰胺的侧链多一个亚甲基。

图2.12 天冬酰胺和谷氨酰胺的结构。这两种氨基酸是含有酰胺的极性氨基酸。

半胱氨酸在结构上类似丝氨酸,但是用巯基替代了羟基(图2.13)。巯基比羟基活泼。一对巯基靠近可以形成二硫键,稳定蛋白质的结构。后面我们将简短地讨论这种情况。

图2.13 半胱氨酸的结构。

下面我们讨论带电荷的氨基酸,它们都是高度亲水的氨基酸。赖氨酸和精氨酸的侧链长,在中性pH时侧链末端带正电荷。赖氨酸侧链的末端是氨基,精氨酸侧链的末端是胍基。组氨酸含有咪唑基,咪唑基是芳香环,也能被质子化后带正电荷(图2.14)。

图2.14 碱性氨基酸:赖氨酸,精氨酸和组氨酸。

咪唑的pKa值接近于6,在中性pH附近的溶液中咪唑基既可以质子化也可以不带电荷,实际情况取决于咪唑基团所在的局部环境(图2.15)。组氨酸常在酶的活性中心。在酶促反应中咪唑环既可以结合质子,有可以释放质子。

图2.15 组氨酸离子化。在生理pH时组氨酸能接受质子或释放质子。

还有两个酸性氨酸,即天冬氨酸和谷氨酸(图2.16)。这些氨基酸常常被称为天冬氨酸盐和谷氨酸盐,主要是强调这两种氨基酸在生理pH溶液中侧链基团解离,因此带负电荷。在有些蛋白质中这两种氨基酸的作用是接受质子,对蛋白质功能起重要作用。

图2.16 侧链有羧酸离子的氨基酸。

20种氨基酸中有七种氨基酸的侧链能发生解离,它们要么接受质子,要么释放质子。这种性质能够促进反应进行或有利于形成离子键。表2.1列出了酪氨酸、半胱氨酸、精氨酸、赖氨酸、组氨酸、天冬氨酸和谷氨酸侧链基团的解离方程式及pKa值。

氨基酸既可以用三个字母表示也可以用一个字母表示(表2.2)。除了天冬酰胺(Asn),谷氨酰胺(Gln),异亮氨酸(Ile),和色氨酸(Trp)外,用三个字母表示氨基酸的就是用这个氨基酸的英文名称的前三个字母。用一个字母表示氨基酸的时候,多数氨基酸就是用这个氨基酸英文名字的第一个字母表示(如G表示甘氨酸,L表示亮氨酸);另一些氨基酸是根据协定命名的。这些缩写和符号属于生化工作者的语言词汇。

氨基酸是如何变成蛋白质原料的?首先氨基酸在结构和化学反应性差异大,使蛋白质式样多、能够执行各种各样的生物功能。其次这些氨基酸在前生命时期就已经产生。最后,其它可能出现的氨基酸可能太活泼。例如高丝氨酸和高半胱氨酸易于形成五元环,使蛋白质无法利用这些氨基酸。而蛋白质中出现的丝氨酸和苏氨酸不会形成环(因为环太小)(图2.17)。

图2.17 氨基酸不需要的反应性。有些氨基酸易环化不能充当蛋白组分。高丝氨酸能环化形成稳定的五元环,导致肽键断裂。丝氨酸环化就会产生有张力的四元环,因此很难环化。X表示相邻的氨基酸或另一个要离去的基团。

2.2 一级结构:肽键连接的氨基酸序列

在蛋白质分子中,一个氨基酸的??氨基与另一个氨基酸的??羧基形成肽键。蛋白质就是氨基酸经肽键连接形成的线形聚合物。两个氨基酸脱水聚合形成二肽(图2.18)。在大多数条件下这个反应的平衡偏向肽键水解。肽键形成需要输入自由能。但是肽键水解的速度很慢,没有催化剂时在水中水解肽键需要1000年。

图2.18 肽键的形成。失去一分子水后形成肽键,导致两个氨基酸连接形成二肽。

将一系列氨基酸用肽键连接的产物叫多肽。多肽链中的每个氨基酸单位叫氨基酸残基。如此连接的多肽链有极性,一端是??氨基,另一端是??羧基。通常将氨基端作为多肽链的起始,羧基端作为多肽链终止。因此多肽链的书写是从氨基端开始的。五肽链Tyr-Gly-Gly-Phe-Leu(YGGFL)中酪氨酸残基在N-端,亮氨酸残基在C-端(图2.19)。Leu-Phe-Gly-Gly-Tyr(LFGGY)就是另一个五肽,其化学性质与前一个五肽根本不同。

图2.19 氨基酸序列有方向。五肽Tyr-Gly-Gly-Phe-Leu(YGGFL)从氨基端向羧基端的方向。该五肽是Leu-脑啡肽,一种阿片类肽,能够调节疼痛意识。

多肽链的骨架或主链是有规则的重复,可变部分是侧链(图2.20)。多肽链骨架富有氢键形成的潜力。每个氨基酸残基含有一个羰基,它是氢键的氢原子受体;除了脯氨酸外,每个氨基酸残基还有一个NH基团,它是氢键的氢原子供体。这些基团之间相互作用,或者这些基团与侧链其它功能基团相互作用,稳定蛋白质特定结构,这些将在2.3节讨论。

多数天然多肽链有50-2000氨基酸残基,称之为蛋白质。已知的最长蛋白质是肌肉蛋白titin,有27000个氨基酸残基。含有较少氨基酸残基的多肽叫寡肽,或简称为肽。氨基酸残基的平均分子量是110gm mol-1,所以大多数蛋白的分子式量是5500至220,000gm mol-1。我们也叫这种分子式量为蛋白质量。一个蛋白质的分子重量是50,000gm mol-1,其质量是50kD。

有些蛋白质线性多肽链发生交联。最常见的交联形式是二硫键。二硫键是一对半胱氨酸残基之间氧化脱氢的结果(图2.21)。用二硫键交联的两个半胱氨酸叫胱氨酸(cystine)。细胞外蛋白质常常有几个二硫键,而胞内蛋白质常常缺乏这些二硫键。其它氨基酸残基侧链之间形成非二硫键连接的事例也有,但很少。例如连接组织的胶原纤维就是用非二硫键的链间连接强化,血液凝固的纤维原也采用这种方式。

蛋白质的氨基酸序列是基因决定的

1953年Frederick Sanger确定了胰岛素的氨基酸序列(图2.2),首次证明蛋白质(1)有特定的氨基酸序列;(2)氨基酸组分是L-型;(3)氨基酸之间的连接是肽键。这项工作是生物化学的里程碑。该工作的完成促进了其他科学家测定更多蛋白的氨基酸序列。现在序列已知的蛋白质达200多万。明显的事实是每种蛋白质都有独特的氨基酸序列。蛋白质的氨基酸序列叫蛋白质的一级结构。

图2.22 牛胰岛素的氨基酸序列。

1950年代后期和1960年代早期的一系列研究证实,蛋白质的氨基酸序列由基因的核苷酸序列决定。DNA的核苷酸序列确定了RNA分子的核苷酸序列,RNA分子的核苷酸序列又决定了蛋白质的氨基酸序列。每个氨基酸由一个或多个特定的三核苷酸序列编码(5.5节)。

知道氨基酸序列很重要。(1)蛋白质氨基酸序列信息是阐明该蛋白质作用(如酶的催化作用)机理所必需的。事实上,已知蛋白质氨基酸序列的变化能产生新的蛋白质特性。(2)蛋白质的氨基酸序列决定了蛋白质的三维结构。氨基酸序列是DNA遗传信息与执行特定生物学功能的蛋白质三维结构之间的联系。分析蛋白质氨基酸序列与蛋白质三维结构之间的关系能揭示控制多肽链折叠的规则。(3)序列测定是分子病理学的一个组成部分,而分子病理学是一个发展迅速的医学领域。氨基酸序列改变产生蛋白质异常功能和疾病。蛋白质内单一氨基酸变异会引起严重的、有时甚至致命的疾病如镰刀细胞贫血病(195)和囊性纤维病变。(4)蛋白质氨基酸序列能揭示蛋白质的进化史(第六章)。如果蛋白质来自同一祖先,蛋白质之间就很相似。因此进化史上的分子事件可以根据氨基酸序列追踪;分子古生物学(paleontology)是一个研究热点。

虽然多肽链有构象限制但仍然可以改变构象

肽骨架的几何形状有几个特征。(1)肽键基本上是平面结构(图2.23)。因此用肽键连接的一对氨基酸中有六个原子处于同一平面。N-端氨基酸的??碳原子和CO基团,C-端氨基酸的NH原子和??碳原子。肽键的本质解释了肽键的平面特性。肽键有双键性质,阻止了原子围绕双键的转动从而限制了肽骨架的构型。

肽键共振结构

图2.23 肽键是平面结构。一对用肽键连接的氨基酸中,六个原子(C?,C,O,N,H,C?)处于同一平面。氨基酸侧链用绿球标出。

肽键的双键性质也从键的长度反映出来。肽键的C-N长度是1.32A,处于C-N单键长度1.49A和C=N双键长度1.27A之间(图2.24)。最后,肽键不带电荷,使肽链能够紧密压缩成球状结构。

图2.24 肽键单位的各种化学键的长度。此处肽键构型是反式结构。

平面肽键可以采用两种构型。在反式构型中,两个??碳原子处于肽键两边。在顺式结构中,两个??碳原子处于肽键的同一边。蛋白质分子中几乎所有肽键是反式结构。原因在于顺式结构的??碳原子所连接的侧链基团有空间障碍,而反式结构就不存在这种空间障碍(图2.25)。至今最常见的顺式肽键是X-Pro之间的肽键。由于脯氨酸的N原子与两个四面体碳原子结合,使反式结构和顺式结构的肽键之间差异不明显(图2.26)。

图2.25 反式和顺式肽键。由于顺式结构存在立体碰撞,反式结构是一种优势结构。

图2.26 X-Pro肽键的反式和顺式结构。因为立体碰撞的情况相似,所以两种结构的能量水平相似。

与肽键不同,氨基与??碳原子之间的化学键以及??碳原子和羰基之间的化学键就是纯粹的单键。两个相邻的肽单位可以围绕这些化学键旋转,产生不同的方向。围绕着两个化学键旋转的自由度使蛋白质有不同的折叠方式。围绕这些化学键旋转的结果可以用扭转角衡量(图2.2.7)。围绕N-?C原子之间化学键旋转的角度叫phi(?)。围绕?C原子和羰基碳原子之间的化学键旋转的角度叫psi (?)。从N原子向?C原子观察、或者从羰基碳原子向?C原子观察,顺时针旋转的角度是正值。?和?的角度决定了肽链走向。

图2.27 多肽链中围绕化学键的旋转。多肽链每个氨基酸结构都是围绕这两个化学键旋转产生的。(A) ?是围绕???C键旋转的角度,?是围绕?C-羰基旋转的角度。(B)从N原子向?C原子观测,确定 ?值。(C)从?C原子向羰基观测,确定 ?值。

?和?角度的各种可能组合都存在吗?Gopalasamudram Ramachandran发现,由于原子之间存在立体障碍,很多?和?角度组合是不容许的。允许的?和?角度数值用二维Ramachandran作图表示(图2.28)。因局部立体碰撞,3/4的?和?角度组合不存在。立体排斥指两个原子在同一时间不能同时出现于同一位臵,这是一个有效的排布原则。

生物大分子的折叠受热力学控制。没有折叠的聚合物是随机盘绕的:各个分子盘绕样式都不相同,产生了很多可能构型。折叠成一致结构就会降低原有的多构型混合物的熵。从热力学角度看,可能构型数量巨大、高度可变的聚合物没有折叠成单一结构的趋势。倒是肽单位的刚性和有限的?和?允许角度导致蛋白质折叠。

图2.28 用Ramachand图谱表示?和?角度。不是所有的?和?角度都会出现(不会造成原子碰撞)。最有利的角度用深绿色表示,边界区域用浅绿色标出。右边标出了一个导致立体碰撞的不利构型。

????多肽链的二级结构:??螺旋、??片层、拐角和环?

多肽链能折叠成有规则的重复结构吗?1951年Linus Pauling和Robert Corey提出了两种周期性出现的结构,即??螺旋和??片层。随后鉴定了其它结构如??拐角和Ω-环。虽然??拐角和Ω-环在蛋白分子内不是周期性出现,但是??拐角和Ω-环普遍存在于蛋白质分子中、并且与??螺旋和??片层一道形成蛋白质的高级结构。??螺旋、??片层和拐角的形成有赖于线形序列(一级结构)邻近氨基酸的N-H和C=O之间形成的氢键。这类折叠段叫蛋白质的二级结构。 ??螺旋是一种多肽链内部氢键稳定的纽绕结构。

在评价潜结构时,Pauling和Corey考虑哪种构型是立体上允许的、哪种完全利用链内骨架的NH和C=O形成氢键。他们提出的第一种结构是棒状结构的??螺旋(图2.29)。??螺旋内部是棒状结构,氨基酸侧链朝外伸展。??螺旋的稳定力量来自骨架主链的NH和C=O之间形成的氢键。一个残基的C=O与第4个残基的NH形成氢键(图2.30)。因此,除了??螺旋末端的氨基酸外,螺旋内每个残基的NH和C=O都参与了氢键。每个残基相对于下一个残基而言是旋转了100o,沿螺旋轴上升了1.5A。因此??螺旋一周需要3.6个氨基酸,螺距是5.4A。因此,氨基酸序列相隔3-4个氨基酸的残基在??螺旋内靠得很近,而相隔两个氨基酸的处于螺旋对立面无法靠近。螺旋方向可以是左手(顺时针方向),也可以是右手(逆时针方向)。Ramachandram作图指出左手螺旋和右手螺旋都是允许的(图2.31)。但是实际上右手螺旋造成侧链和骨架之间的立体障碍小,是能量有利的优势结构。蛋白质分子的??螺旋基本上都是右手螺旋。在蛋白结构示意图中,用缠绕的丝带或棒表示??螺旋(图2.32)。

图2.30 ??螺旋结构的氢键形成方案。在??螺旋结构中氨基酸残基i的C=O基团与该多肽链的第i+4位氨基酸残基的NH基团形成氢键。

图2.29???螺旋结构。(A)标出了??碳原子和侧链(绿色)的绸带结构式。(B)NH和C=O之间氢键用虚线标出??螺旋的球-棒结构侧视图。(C)从末端向螺旋骨架内部观测的结构图,其中侧链(绿色)向螺旋外凸出。(D)图C的空间填充模型,表明螺旋内部核堆积紧密。

图2.31 螺旋的Ramachandran图谱。右手和左手??螺旋结构在Ramachandram图谱中都是允许的,但是在蛋白质分子中实际上只有右手??螺旋结构。

图2.32 ??螺旋结构草图。(A)球-棒结构模型。(B)绸带结构式。(C)圆柱结构式。

Pauling和Corey预测出蛋白质??螺旋六年后才在肌红蛋白的x-射线重构的蛋白质结构中观察到这种结构。蛋白质??螺旋结构的阐明是生物化学领域的里程碑,因为这件事证明如果我们知道多肽链各组分的全部性质,我们就能够预测多肽链的构型。

不同蛋白质的??螺旋结构含量是不同的。有的蛋白质根本就没有??螺旋结构,有的蛋白质全都是??螺旋结构。储存铁的铁蛋白75%的氨基酸残基是??螺旋结构(图2.33)。实际上25%的可溶性蛋白质含有用拐角和环连接的??螺旋结构。单个??螺旋结构的长度通常不超过45A。很多跨膜蛋白也含有??螺旋结构。

图2.33 主要是??螺旋结构的蛋白质。铁储存蛋白ferritin有一捆??螺旋结构。

片层依靠多肽链之间氢键稳定其结构

Pauling和Corey提出的另一种蛋白周期性结构是??片层(之所以称为??,是因为他们先阐明的蛋白质结构已经取名为??)。??片层与??螺旋在结构上有明显的不同。形成??片层的多肽链有两条或多条。各个??链几乎完全伸展,而??螺旋是紧密缠绕的多肽链。一定程度的伸展结构在立体化学上是允许的(图2.34)。

图2.34 ??链的Ramachandran作图。红色区域是立体化学允许??伸展链结构。

沿??链相邻氨基酸的距离是3.5A,而??螺旋相邻氨基酸的距离是1.5A。相邻氨基酸残基侧链处于相反的方向(图2.35)。片层结构是两条或多条??链毗邻排列,依靠链间氢键连在一起。??片层相邻的两条多肽链可以是同向排列(平行??链),也可以是反向排列(反平行??链)。在??链反平行排列的??片层中,每个氨基酸残基的C=O和NH都会与配对多肽链相应的NH和C=O形成氢键(图2.36)。在??链平行排列的??片层中,氢键的形成方案就复杂些。一条链氨基酸残基x的NH基团与配对链氨基酸残基y的C=O形成氢键,但是x的C=O基团却与该残

基下游第2个氨基酸残基的NH形成氢键(图2.37)。??片层可以将很多??链(通常是4-5条,但最多可以达到10条以上)结合在一起。这种??片层结构可以是纯粹的反平行排列,也可以是纯粹的平行排列,也可以是平行和反平行均存在的混合排列(图2.38)。

图2.35 ??链结构。侧链在??链平面上下交替出现。

图??????反平行排列的??片层。相邻的??链排列方向相反。一条链某一氨基酸残基的C=O和NH基团与配对链单个相邻氨基酸的NH和C=O基团分别形成氢键,稳定??片层结构。

图2.37 平行排列的??片层。相邻??链方向相同。一条链某一氨基酸残基的C=O和NH基团分别与配对链一个氨基酸的NH和该氨基酸下游第二位氨基酸残基的C=O基团形成氢键,稳定??片层结构。

图2.38 混合b-片层结构。

在示意草图中,??链常常被划成带有箭头的条带。表示??链C-端的箭头显示??片层排列模式(是同向平行排列、反向平行排列、还是混合排列)。??片层结构比??螺旋结构的式样多。??片层几乎是平坦的,但多数情况下??片层有点扭曲(图2.39)。在很多蛋白质分子中,??片层是一种重要的结构元件。例如,对脂肪代谢非常重要的脂肪酸结合蛋白几乎全部是??片层结构(图2.40)。

图2.39 扭曲的??片层。(A)球-棒结构模型。(B)??片层结构草图。(C)图B是旋转90度的视觉图,表明??片层有扭曲。

图2.40 富含??片层结构的蛋白质。脂肪酸结合蛋白的结构。[]Drawn from1FTP.pdb]

反向拐弯和环使多肽链改变方向

由于多肽链的方向可以转向,多数蛋白质呈压缩紧密的球状结构。发生方向逆转的肽链常常有反向拐弯(也称??拐弯或发夹拐弯),如图2.41。很多逆向拐弯结构中,第i位氨基酸残基的C=O基团与第i+3位的氨基酸残基的NH基团形成氢键。这种相互作用能稳定多肽链方向急拐的结构。在另一些情况下,肽链转向采用环来完成,有时称这种环为Ω环。与??螺旋和??片层不同,环没有规则的周期性结构。但是环的结构坚固、有明确的结构。拐角和环处于蛋白质表面,常常参与蛋白质与其它分子的相互作用。

图2.41 反向拐弯的结构。第i位氨基酸残基的C=O基团与第i+3位氨基酸残基的NH基团形成氢键稳定肽链拐弯。

图2.42 蛋白表面的环。抗体蛋白表面有环状结构的区域。用红色显示与其它分子相互作用的环状结构。[Drawn from 7FTP.pdb]

纤维蛋白为细胞和组织提供结构支持

在??角蛋白和胶原蛋白分子中存在特殊螺旋。这些蛋白质形成起结构作用的长纤维。??角蛋白是毛发的主要成分,含有两股??螺旋。这两股螺旋相互缠绕,形成左手超螺旋,也叫螺旋的螺旋。??角蛋白是螺旋的螺旋家族蛋白(图2.43)的成员。在这些蛋白中,两股或更多股??螺旋缠绕扭曲形成非常稳定的、长度达1000A或更长的结构。人类的螺旋的螺旋蛋白家族大约有60个成员,包括构成细胞骨架的中度纤丝,肌动蛋白和原肌球蛋白(34.2节)。这个家族蛋白的特征是中央300个氨基酸残基含有不完美的7氨基酸序列重复,称为七残基重复(heptad repeat)。

图2.43 ??螺旋的螺旋。(A)空间填充模型。(B)绸带示意图。两股螺旋相互缠绕形成超螺旋。很多蛋白质有这样的结构,包括头发、羽毛、脚爪、动物角。[Drawn from 1CIG.pdb]

??角蛋白两股螺旋之间有弱作用(如离子键和范德华力)。两股螺旋相互间进行的左手螺

旋缠绕改变了原来每股右手螺旋结构,使右手螺旋每轮从3.6氨基酸残基变成3.5残基。这种改变有利于两股螺旋之间的相互作用。侧链相互作用的模式是每7个氨基酸残基重复一次,形成七氨基酸残基重复。如果重复完美,具有这种重复的两股螺旋就能相互作用(图2.44)。如重复残基有疏水侧链,它们之间就有范德华力;若重复残基有电荷相反的基团,则形成离子键。如果相邻的氨基酸残基是半胱氨酸,则两个螺旋之间能形成二硫键。螺旋之间的相互作用能解释毛发如??角蛋白的理化性质。由于这类蛋白是两股??螺旋依靠链间相互作用缠绕而成,因此破坏链间相互作用能使毛发长度几乎伸展至原有长度的2倍。如果两条肽链之间的二硫键没有遭到破坏,取消拉力毛发长度恢复到从前的水平。??角蛋白链间二硫键的数目决定了纤维蛋白的特性。毛发蛋白链间二硫键数目少,容易变形。但是脚爪蛋白链间二硫键多,相应地蛋白就更加坚固。

图2.44 螺旋的-螺旋蛋白内有七氨基酸重复。每个螺旋链中,每个七氨基酸重复的第7个氨基酸是亮氨酸。两股螺旋相互靠近主要依赖于亮氨酸残基间的van der Waals相互作用。

哺乳动物含量最丰富的胶原蛋白有不同的螺旋类型。胶原蛋白是皮肤、骨,键(tendon)、软骨(cartilage)、和牙齿主要的纤维蛋白成分。该蛋白处于胞外,是长度约为3000A、直径只有15A的棒形分子。胶原蛋白含有三股螺旋多肽链,每条多肽链有1000氨基酸残基。在氨基酸序列中每三个氨基酸就有一个甘氨酸。多肽链序列富含甘氨酸-羟基脯氨酸(图2.45)。羟基脯氨酸是羟基取代吡咯环一个氢原子的脯氨酸衍生物。

图2.45 胶原蛋白链的部分氨基酸序列。每个三氨基酸就有一个甘氨酸。脯氨酸和羟脯氨酸的含量也很高。

胶原蛋白螺旋的性质与??角蛋白螺旋的特性不同。胶原蛋白没有链内氢键。实际上,胶原蛋白多肽链内的螺旋依靠脯氨酸吡咯环之间的立体排斥力(图2.46)。当多肽链形成螺旋时,脯氨酸的吡咯环相互排斥,多肽链每个拐角大约有三个氨基酸残基。三股螺旋链相互缠绕形成的超螺旋则依靠链间氢键。甘氨酸残基的NH基团与另一条链氨基酸残基的C=O基团形成氢键。羟基脯氨酸也参与了链间氢键。没有羟基脯氨酸的羟基,就会患坏血病(scurvey)(27.5节)。

图2.46 胶原蛋白三链螺旋中每条多肽链的构型。

三股螺旋的内部排列非常拥挤。这解释了每三个氨基酸残基序列中第三个氨基酸必须是甘氨酸的原因(图2.47A)。只有甘氨酸才能臵于三链螺旋内部。而甘氨酸两侧的氨基酸残基均处于三链螺旋外侧,那里能够容纳脯氨酸和羟脯氨酸的大侧链(图2.47B)。

图2.47 胶原蛋白的结构。(A)胶原蛋白结构的空间填充模型。用不同的颜色表示不同的多肽链。(B)胶原蛋白模型链间交联的截面图。甘氨酸残基的??碳原子用G表示。每个三氨基酸序列的第三位肯定是甘氨酸,因为螺旋内的空间很小只能容纳甘氨酸。注意吡咯环处于三链螺

旋的外侧。

2.4 蛋白质三级结构:水溶性蛋白折叠成具有非极性核的紧密结构

我们现在考察一个完整的蛋白质分子中氨基酸如何聚集在一起的。X-射线晶体衍射技术和核磁共振光谱分析(3.6节)确定了几千种蛋白质的三维结构。现在我们看看肌红蛋白的三维结构,第一例原子空间结构明了的蛋白质。

肌红蛋白是肌肉组织的氧运输蛋白质,其多肽链由153个氨基酸残基组成(见第7章)。肌红蛋白结合氧的能力依赖于血红素。血红素是由原卜啉IX和中心铁原子构成的非肽链辅助基团。肌红蛋白折叠压缩紧密,其大小是45 x 35 x 25A,比完全伸展的肽链小一个数量级(图2.48)。约70%的多肽链折叠成8个??螺旋,其余的肽链是螺旋间的拐弯和环状结构。

图2.48 肌红蛋白的三维结构。(A)绸带图显示多肽链主要是??螺旋结构。(B)与图A相同方向的空间填充模型显示折叠多肽紧密压缩。注意血红素辅基臵于血红蛋白的裂缝中,只有一个边缘暴露。有一个螺旋用蓝色表示,有利于进行对该结构的两种图谱进行比较。

肌红蛋白主链的折叠与大多数其它蛋白质的折叠一样,复杂且没有对称性。多肽链总的折叠模式就是蛋白的三级结构。在三级结构中,氨基酸残基侧链的分布有共同的方式。蛋白质内部的氨基酸残基侧链几乎都是非极性基团,如亮氨酸、颉氨酸、甲硫氨酸、和苯丙氨酸(图2.49)。肌红蛋白内部没有带电氨基酸残基,如天冬氨酸、谷氨酸、赖氨酸和精氨酸。蛋白质内部唯一的极性氨基酸是两个组氨酸。这两个组氨酸对肌红蛋白结合血红素和铁元素极其重要。另外肌红蛋白表面既有极性氨基酸残基,也有非极性氨基酸残基。空间填充模型显示整个蛋白质内部没有什么空余的地方。

图2.49 血红蛋白的氨基酸分布。(A)空间填充模型,其中疏水性氨基酸用黄色表示、带电氨基酸用蓝色表示、其它氨基酸用白色表示。注意蛋白质分子表面有很多带电氨基酸和很多疏水氨基酸。(B)空间填充模型截面图。注意蛋白质分子内部大多数残基是疏水氨基酸,而带电氨

基酸只在分子表面。[Drawn from 1MBD.pdb]

极性氨基酸和非极性氨基酸分布的反差反映了构建蛋白质空间结构的重要原则。在水溶液环境中,疏水性氨基酸受水分子排斥的倾向强烈,驱使蛋白质进行折叠。当疏水侧链聚集(而不是伸展到水环境中),蛋白质热力学稳定。因此蛋白质分子折叠使疏水侧链包埋到蛋白质内部、极性带电氨基酸暴露于分子表面。很多??螺旋和??片层是两性的,即有疏水面和亲水面。疏水面朝向分子内部,亲水面指向溶液。多肽主链的命运受疏水侧链的影响。没有形成氢键的主链NH和CO基团更倾向于水环境,而不倾向于疏水环境。将疏水侧链包埋于分子内部的秘密就在于主链所有的NH和CO都能配对形成氢键。因此??螺旋和??片层的主链均有主链NH和CO配对形成氢键。紧密压紧的疏水侧链形成范德华力,这种结合力对稳定蛋白质结构有贡献。现在我们就能够理解为什么20种氨基酸侧链有不同的大小和形状。氨基酸大小和形状的差异可以提供各种选择,只有那些大小和形状完全匹配的氨基酸残基才被蛋白质选中。此时侧链基团能密切靠近,范德华力最大。

有些蛋白质能够跨越细胞膜。这些跨膜蛋白质就不遵循上述原则。疏水氨基酸在分子表面而亲水氨基酸残基处于分子内部,如细菌的外膜蛋白porin(图2.50)。膜主要是用长脂肪链构建的(12.2节)。因此外膜蛋白porin表面主要是疏水氨基酸残基,它们与相邻的脂肪链相互作用。而蛋白质中心有很多极性氨基酸残基和带电氨基酸残基。因为膜蛋白分子中心充满水分子。由于外膜蛋白在疏水环境执行其功能,因此与那些在水溶液环境执行功能的蛋白质相比结构发生了内外翻转。

图2.50 外膜蛋白porin将氨基酸位臵“内外翻转”。与生物膜疏水脂肪链接触的外膜蛋白外部氨基酸残基主要是疏水氨基酸,而与中心充满水分子接触的蛋白质内部则有很多极性氨基酸和带电氨基酸残基。[Drawn from 1PRN.pdb]

很多蛋白质具有相同的二级结构组合,这些二级结构组合常常有相似的生物功能。我们称这种二级结构组合为模体(motif),或超二级结构。如用拐弯连接两个??螺旋构成的模体,即螺旋-拐弯-螺旋,存在于很多DNA结合蛋白质(图2.51)。

有些多肽链能折叠成两个或多个紧密区域,而这些紧密区域之间用一个柔软的肽段连接,看上去像一根绳子串起的珠子。每个紧密地区域叫结构域(domain)。结构域的大小范围不同,从30氨基酸残基到400氨基酸残基不等。例如一些免疫细胞表面蛋白CD4的胞外部分(能与HIV结合)有4个长度约为100氨基酸残基的相似的结构域(domain)(图2.52)。有些蛋白质即使三维结构互不相同,但可能有相同的结构域。

图2.51 螺旋-拐弯-螺旋模体是一种超二级结构元件。螺旋-拐弯-螺旋模体常见于DNA结合蛋白。[Drawn from 1LMB.pdb]

图2.52 蛋白质的结构域。细胞表面蛋白CD4有四个相似的域。

2.5 蛋白质四级结构:蛋白质多肽链组装的多亚基结构

在介绍蛋白质结构时常常提到蛋白质结构的四个水平。至今我们已经介绍了三个水平。二级结构是序列上相互靠近的氨基酸残基的空间排列。有些二级结构有规则性,产生周期性结构特征。??螺旋和??片层就是二级结构元件。三级结构是那些序列上差距很大的氨基酸残基的空间排列及二硫键。我们现在讨论含有一个以上多肽链的蛋白质结构。这种蛋白质结构有四个结构水平。这样的蛋白质分子中每个多肽链是一个亚基。四级结构就是蛋白质亚基的空间排列,即亚基之间的相互作用。有最简单四级结构的蛋白质是含有两个相同亚基的二聚体。?-噬菌体的cro蛋白是DNA结合蛋白,有两个相同的二聚体(图2.53)。常见的蛋白质有更复杂的四级结构,有的蛋白亚基不止一种类型,有的蛋白亚基数量有差异。例如人血液的运氧蛋白(即血红蛋白)有四个亚基。其中两个亚基属于??型,另两个亚基属于??型(图2.54)。因此血红蛋白是????四聚体。血红蛋白分子亚基排列的细微变化使该蛋白质能有效地将肺部氧气运输到身体各组织的功能(第7章)。

图2.53 四级结构。?-噬菌体Cro蛋白质是完全相同亚基构成的二聚体。[Drawn from 5CRO. pdb]

图2.54 人血红蛋白????四聚体。????四聚体中两个?亚基(红色)是完全相同的,两个?亚基(黄色)也完全相同。?亚基的结构与?亚基的结构相似但有差异。一个血红蛋白分子有四个血红素(灰色),每个血红素辅基有一个铁原子(紫色)。(A)绸带结构显示四个亚基结构类似,主要是??螺旋结构。(B)空间填充模型显示血红素辅基占据蛋白质的裂缝。[Drawn from 1A3N. pdb]

病毒是遗传信息有限的生物。它们重复使用同一亚基,对称性排列构建病毒外壳。引起普通感冒的鼻病毒(rhinovirus) 外壳蛋白有4个亚基,每个亚基有60拷贝(图2.55)。这些亚基聚集在一起形成病毒的球形外壳,将病毒基因组包裹在外壳内。

图2.55 复杂的四级结构。人鼻病毒(导致普通流感的病毒)的外壳有四种亚基(用不同颜色表示),每种亚基有60拷贝。

2.6 蛋白质的氨基酸序列决定其三维结构

蛋白质如何获得其精细的三维结构?1950年代Christian Anfinsen对核糖核酸酶进行的经典研究揭示了蛋白质氨基酸序列与蛋白质构型(即空间结构)之间的关系。核糖核酸酶是124个氨基酸残基构成的单一肽链,有四个二硫键(图2.56)。Anfinsen破坏该酶的三维结构,然后确定恢

复酶蛋白结构所需要的条件。

图2.56 牛核糖核酸酶的氨基酸序列。四个二硫键用颜色标出。[after C H W Hirs, S Moore, and W H Stein, J Bil Chem 235(1960):633-647]

尿素和盐酸胍能有效地破坏蛋白质的非共价键,但至今还不清楚这些变性剂破坏这些非共价键的作用机制。用还原试剂如??巯基乙醇(图2.57)能够可逆地破坏二硫键。当??巯基乙醇大大过量,胱氨酸的二硫键完全转化成半胱氨酸。

图2.57 ??巯基乙醇能还原二硫键。注意随着二硫键的还原,??巯基乙醇被氧化。

在8M尿素或6M盐酸胍溶液中,没有交联键(如二硫键)的大多数多肽链变成螺旋已经松散的结构。在??巯基乙醇存在下用8M尿素处理核糖核酸酶,??巯基乙醇消除了核糖核酸酶的二硫键、螺旋松散、没有酶活性。当一个蛋白质处于螺旋松散没有正常生物活性状态时,我们称这个蛋白质已经变性(denatured)(图2.58)。

图2.58 核糖核酸酶还原和变性。

Affinsen考察变性核糖核酸酶的复性。采用透析的方法除去??巯基乙醇和尿素,核糖核酸

酶的活性又慢慢恢复。他马上意识到这一发现的意义:变性蛋白的巯基被空气氧化成二硫键,酶又自动折叠成有催化活性的状态。后来详细研究揭示,如果巯基的氧化条件合适,变性蛋白复性几乎能恢复所有的酶活性。重新折叠蛋白质的理化性质与天然蛋白质没有差异。这些实验证明,有酶促活性的核糖核酸酶结构实际上已经包含于该蛋白质的氨基酸序列。后续研究证明了蛋白质都遵循这一生物化学中心原则,即氨基酸序列决定蛋白质构象。由于蛋白质构象与蛋白质功能密切相关,因此氨基酸序列决定蛋白质构象就具有特别的意义。

如果还原核糖核酸酶在8M尿素存在时进行氧化,然后透析除去尿素,只能恢复1%的酶活性。如果先除去尿素,再进行氧化则能恢复100%的酶活性。为什么有这么大的差异?原因在于尿素的存在使多肽链形成二硫键交联的位臵发生错误。在尿素存在时,形成二硫键的可能组合有105种,但是只有一种与天然蛋白质完全相同。其余104种二硫键交联方式都是错误的,没有酶促活性。不过,Affinsen加入微量??巯基乙醇到上述活性很低的蛋白质复性溶液中也能将那些没有活性的蛋白质转化成有活性的核糖核酸酶(图2.59)。后来添加的??巯基乙醇促进二硫键重排至天然结构,这一过程大约需要10小时。折叠错误的构型自由能高,转化成稳定的有活性的天然结构时蛋白质自由能低。天然二硫键的交联模式能稳定具有热力学优势的蛋白质结构。

图2.59 重新构建正确的二硫键。在痕量的?-巯基乙醇存在下,二硫键位臵错误的核糖核酸酶能转化成二硫键位臵正确的天然核糖核酸酶。

用其它蛋白质也进行了类似的蛋白质重新折叠试验。在合适条件下,多数蛋白质能重新折叠成天然结构。但是也有些蛋白质变性后重新折叠成天然蛋白质的效率不高。这些蛋白的非折叠状态蛋白易于相互聚集。在细胞内,分子伴侣(Chaperon)能够阻止分子间非法的相互作用。

氨基酸形成??螺旋、??片层、和??拐弯能力不同

蛋白质的氨基酸序列怎样确定蛋白质的三维结构?没有折叠的多肽链如何获得天然结构?要回答这些基本的生物化学问题,首先要确定各种氨基酸形成??螺旋、??片层、和??拐弯能力。一种方案是考察各种氨基酸在??螺旋、??片层、和??拐弯结构中出现的频率(表2.3)。如丙氨酸、谷氨酸、和亮氨酸多在??螺旋,而颉氨酸、异亮氨酸多在??片层。甘氨酸、天冬氨酸和脯氨酸倾向于拐弯结构。

对蛋白质和合成多肽进行的研究揭示了氨基酸残基对??螺旋、??片层、和??拐弯结构倾向的部分原因。??螺旋是预臵构型(default conformation)。但是??碳原子有分支结构(如颉氨酸、苏氨酸、异亮氨酸)时,??螺旋结构将出现原子的立体碰撞。这些残基倾向于??链结构(侧链凸出于多肽主链平面外)。丝氨酸、天冬氨酸和天冬酰胺因有氢键供体或受体的侧链与主链很近,能竞争主链相应的氢键受体或供体不利于??螺旋结构的稳定。由于脯氨酸缺乏NH基团、其环状结构将?角度限制在60o左右,所以脯氨酸会破坏??螺旋和??片层。甘氨酸适于任何类型的结构,因此这个氨基酸对??螺旋并无偏好。

利用氨基酸残基构型的偏好性能够预测蛋白质的二级结构吗?长度是六氨基酸残基或更少的肽段,预测二级结构的准确性达到60%~70%。那么,有没有更为准确的预测方法?注意,氨基酸残基的倾向性结构并不是在所有情况下占统治地位(表2.3)。例如谷氨酰胺倾向于??螺旋结构只是??片层结构倾向性的两倍。其它氨基酸残基的结构倾向性大多数比谷氨酰胺还弱。实际上有些五肽或六肽在一蛋白质中采用一种结构,但在另一种蛋白质中会采用完全不同的另一种结构(图2.60)。因此有些氨基酸序列没有唯一的二级结构。三级水平的相互作用(即在氨基酸序列上相距很远的氨基酸残基之间的相互作用)在确定一些氨基酸序列所选用的二级结构方面可能起关键作用。一段氨基酸序列的前后内容也影响这段氨基酸序列的二级结构选择。蛋白质构型进化的结果使该蛋白质在特定环境或特定的前后序列环境中能发挥作用。用家族蛋白的相关序列(这些序列常常采用相同的结构)修改蛋白质二级结构预测方案,能够改进预测结果。

图2.60 同一序列的肽段在不同蛋白质分子中采用不同的二级结构。有很多序列在不同蛋白质分子中有不同的二级结构。VDLLKN(用红色表示)在一种蛋白质(左边)中是??螺旋,而在另一种蛋白质分子中是??链(右边)。[Drawn from 3WRP. Pdb(left) and 2HLA(right). pdb]

蛋白质错误折叠与一些神经疾病有关

直到最近人们仍然认为所有的传染性疾病都是病毒或细菌感染所致。但现代医学有一个称奇的发现:有些神经性传染病是一种大小与病毒相当,但只含有蛋白质的传染剂。这些疾病包括疯牛病(mad cow disease, bovine spongiform encephalopathy),以及其它生物体的类似疾病如人类的Creutzfeldt-Jacob disease (CJD) 和羊的瘙痒病(scrapie)。导致这些疾病的试剂叫阮病毒(prion)。Stanley Prusiner首先提出纯粹蛋白质也能传播疾病的概念,并因此获得1997年诺贝尔生理学和医学奖。

这些传染剂有下列特征:

1. 传染试剂是积聚形式的特定蛋白质。参与积聚的分子有数量差异。 2. 积聚后蛋白质能够耐受多数蛋白质不能耐受的处理条件。 3. 主要成分或全部成分是一种胞内蛋白(PrP),在正常情况下PrP存在于大脑组织。

积聚状态与脑内正常蛋白在结构上有什么差异?脑内正常的PrP蛋白大多数区域是??螺旋,少数区域是b?链。由于这种蛋白质积聚状态不均一、而且难溶解,因此至今没有确定患者脑组织的PrPSC结构。但是不同的证据显示原来的??螺旋或??拐弯在患者组织转化成??链。一个蛋白质分子的??链与另一个蛋白质的??链相互作用形成??片层,导致蛋白质积聚。纤维蛋白积聚常被称为淀粉样形式。

所以,prion类疾病是大脑内已有蛋白质的积聚所致。有人提出了这种疾病的传播模型(图2.61)。蛋白积聚成为PrP异常的核心,其它PrP蛋白将粘合在这个核心上。因此Prion疾病的传播就是一个患者的PrP异常的核心颗粒传播到另一个体,产生了1990年代英国疯牛病流行。当初用患病牛做成的动物饲料饲养牛,又导致后者也患上疯牛病。

图2.61 Prion疾病传播的模型。

有些非传染性神经退化疾病如Alzheimer和Parkinson疾病患者的脑组织也有淀粉样纤维,Alzheimer患者多肽链A?发生淀粉样蛋白积聚。多肽链A?来源于APP(即淀粉样前体蛋白)。APP经特殊蛋白酶切后产生淀粉样变性。尽管这些蛋白质不溶解,但是用NMR解析出多肽链A?(固态而不是液态)的详细结构。如我们所料,多肽链转化成富含??链的结构形式,后者形成平行排列的??片层伸展结构(图2.62)。

这种积聚如何导致携带这种蛋白质的细胞死亡?目前的答案还是相互矛盾的。一种假设是大积聚体本身没有毒性,但同一蛋白的小积聚体也许会损伤细胞膜,成为细胞死亡的元凶。

图2.62 淀粉样纤维的结构。固相NMR研究推测A?的结构模型显示蛋白积聚源于大的平行b-片层的形成[From A. T. Petkova, et al. Proc Natl Acad Sci USA 99(2002): 16742 - 16747.]

蛋白质折叠是协同进行的

如同早先所指出的,加热或用化学变性剂如尿素或盐酸胍处理能变性蛋白质。很多蛋白质变性程度与变性剂浓度之间的关系显示蛋白质从折叠状态(天然形式)到非折叠状态(变性形式)的转化曲线相当急促,提示蛋白质变性过程中主要构象成分就是两种(即折叠的天然状态和没有折叠的变性状态)(图2.63)。如果将变性剂从蛋白质溶液中移去,使蛋白质从变性状态恢复折叠成天然状态,其复性过程也是非常急促的。

图2.63蛋白质折叠和非折叠的急促转化显示这种转化呈“全是”或“全不是”的协同过程。将蛋白质臵于部分蛋白处于热力学不稳定的条件下,由于部分结构已经变性,它们将与蛋白质分子内其它区域相互作用,导致其余区域的结构不稳定使蛋白质分子的全部结构变成非折叠状态(即变性形式)。这一特性能够合理解释蛋白质变性的协同特征。

图2.63 从折叠状态转化成非折叠状态。增加变性剂浓度,大多数蛋白质从折叠状态变成非折叠状态的转变过程很急。

图2.63 从折叠转化成非折叠状态。逐步增加变性剂浓度使蛋白质从折叠转化成不折叠状态,大多数蛋白质呈现出结构急促转化的特征。

分析在折叠和非折叠转化曲线的中点蛋白质折叠状态能解释蛋白质协同性折叠的结果。在这种条件下蛋白质处于“半折叠”状态。但是蛋白质溶液没有一个“半折叠”分子,而是50%的蛋白质是全折叠的天然结构和50%的蛋白质是全变性的非折叠结构(图2.64)。虽然宏观上看,此条件下的蛋白质溶液似乎只有两种结构,但是从原子角度看,这种简单的两结构是不真实的。在全折叠的天然蛋白结构和全不折叠的变形蛋白结构之间肯定有不稳定的中间转化状态。确定这些中间转化状态是生物化学研究的热点之一。

图2.64 部分变性蛋白质溶液的蛋白质组分。在半折叠蛋白质溶液中,有50%蛋白质是全折叠(天然结构),50%蛋白质是全不折叠(变性结构)。

蛋白质折叠是一个渐进稳定过程而不是随机搜寻过程

变性蛋白质如何转化成天然蛋白(全折叠状态)?一种可能是蛋白质呈现各种可能的空间结构,然后从中寻找热力学上最稳定的空间结构。如果这样,1种长度达到100个氨基酸残基的蛋白质进行这类稳定结构搜寻需要多长时间?Cyrus Levinthal假定一个氨基酸残基有3种构象选择,那么该蛋白质就有3100种可能结构(相当于5 x 1047种)。如果将一种结构转化成另一种结构需要10-13秒,整个搜寻过程需要5 x 1047 x 10-13秒(即1.6 x 1027年)。因此从所有可能出现的蛋白结构搜寻正确结构所需的时间太长了。计算时间与蛋白质折叠实际所需要的时间之间的差异称为Levinthal矛盾。该矛盾证明蛋白质折叠不是尝试所有可能的折叠模式,而是用完全折叠形式和完全非折叠形式之间的几种中间折叠模式构成部分限定的折叠途径。

解决Levinthal矛盾的一个方法是累积筛选。Richard Dawkins研究猴子随机点击打印机需要多长时间才能打印出\(图2.65)。发现要击打1040次才能成功。但是,如果猴子在某些位点点击的字符正确就不用再点击该点字符,只要求猴子重新点击那些错误字符,就只要几千次点击就可以打印出\。两者之间的关键差异在于前者是全部随机,后者是保留部分正确的中间体(仅修改错误)。

蛋白质折叠也有保留部分正确的中间体的倾向。但是蛋白质折叠比上述猴子打字试验要复杂多了。第一,没有一个预先就已经知道的标准来判断各个氨基酸残基构象的正确性,从而决定是否保留,而完全依靠临时出现的中间体所具备的自由能加以判断。第二,蛋白质的稳定性很差。长度在100氨基酸残基蛋白质的折叠和非折叠状态自由能的差异只有42kJ/mol(相当于10kcal/mol),因此各个残基对自由能的平均贡献只有0.42kJ/mol (相当于0.1kcal/mol)。这个数据比室温下的热能(2.5kJ/mol)低。如此细微的稳定能量提示哪些中间体(尤其是早期形成的中间体)是否正确的难度很大。就像猴子得自由地敲击正确键盘(而不是仅敲击错误之处)。然而,残基之间的相互作用产生的协同折叠能稳定构建的中间体结构。因此,有明显结构倾向性的区域,虽然这种倾向性结构不一定对这个局部自身的稳定性重要,但仍然会选择倾向性结构。因为该区域一旦形成这种倾向性结构,就能与该蛋白质其它区域相互作用而进一步提高蛋白质的稳定性。这种模式叫成核-凝聚模型(nucleation-condensation model)。

图2.65 猴子打字。猴子随机敲击打字机书写莎斯比亚Hamlet的句子。如果保存正确字符,只需敲击几千次就能打出正确的语句。每行左边标出了两台打印机所击打的次数。

图2.66是基于成核-凝聚模型进行的蛋白质折叠模拟。该模型提示蛋白质折叠可能倾向于一些途径。尽管图2.66提示蛋白质折叠有不同途径,但每个中间体是一些具有类似结构的代表。因此蛋白质从非折叠状态向折叠状态转变遵循一条通用但不是很精确的途径。蛋白质折叠过程中能量表现如同蛋白质折叠漏斗。漏斗宽表示变性蛋白质有很多结构样式。由于蛋白质进一步折叠导致自由能降低,蛋白质所采用的结构种类减少而进入漏斗下层。具有正确折叠的蛋白质进入漏斗底部。实际上产生最低能量折叠的途径很多。

图2.66 胰凝乳蛋白酶抑制剂的折叠途径。有足够结构倾向性的局部区域先采用其倾向结构(1)。这些结构集合在一起形成核(4)。这种核的结构像天然蛋白质的折叠但结构仍然可变。随后蛋白质彻底聚集形成天然的,更为刚性的结构(5)。[From A. R. Fersht and Daggett. Cell 108 (2002):573-582; with permission from Elsevier]

用氨基酸序列预测蛋白质三维结构存在巨大挑战

用氨基酸序列预测蛋白质三维结构是非常困难的。局部区域预测二级结构的准确性只有60%~70%;而预测蛋白质全分子二级结构和三级结构的预测首先需要知道大范围内残基间的相互作用。

科研人员探讨了两种不同的预测方式。第一种是从头预测,即不依赖抑制结构直接用氨基酸序列进行计算,求出具有最低自由能的折叠结构。这种预测方式受到蛋白质可能折叠结构样式数量庞大、各种折叠模式蛋白稳定性差异细微、和水相溶液中各种相互作用贡献的能量微弱等因素限制。第二种策略是利用已有知识进行预测。现在有越来越多的蛋白质结构已经测定。将你要进行结构预测的蛋白质与结构已知蛋白进行比较。如果有明显类似性,那么你可以用这个已知结构作为模拟结构的出发点进行预测。这种预测方法在研究那些氨基酸序列已知但三维结构未知的蛋白质方面很有用。

蛋白质修饰和裂解使蛋白质具有新功能

仅仅依靠20种氨基酸的多样性,蛋白质就能执行很多功能。此外,很多蛋白质还会发生共价修饰(与非氨基酸的基团共价连接)增加蛋白质功能(图2.67)。例如,很多蛋白质N-端氨基与乙酰基连接,使蛋白质耐受蛋白酶降解能力增加。早先我们曾经说过,脯氨酸羟基化能增加新生胶原蛋白纤维的稳定性。坏血病的发生显示这种修饰的生物学意义。维生素C缺乏导致胶原蛋白羟基化程度不够,异常胶原纤维不能维持组织的正常强度(27.5节)。另一个特别的氨基酸是??羧基谷氨酸。维生素K缺乏,凝血酶原谷氨酸羧基化程度低,导致出血病。有很多蛋白质,尤其是那些处于细胞表面或分泌到细胞外的蛋白质,特定位点的天冬酰胺糖基化(第11

章)。糖基化修饰使蛋白质分子的亲水性增加,能够与其它蛋白质相互作用。相反,氨基酸残基的??氨基或半胱氨酸的巯基与脂肪酸结合使蛋白质疏水性增强。

图2.67 氨基酸侧链修饰。蛋白质氨基酸残基中一些常见的重要的共价键修饰。

有很多激素,如肾上腺素(epinephrine, adrenaline),能刺激蛋白质丝氨酸残基和苏氨酸残基磷酸化从而改变蛋白质的酶学活性。磷脂酰丝氨酸或磷脂酰苏氨酸是蛋白质分子中最常见的修饰氨基酸。生长激素如胰岛素能启动蛋白质酪氨酸磷酰化,产生磷酰酪氨酸。生物体内也能删除这三种氨基酸的修饰基团(磷酸),因此这些氨基酸的磷酰化和去磷酸反应能够可逆调节细胞体内生物过程。第14章将深入讨论蛋白质磷酸化在信号传导过程中的作用。

前面讨论的蛋白质修饰是用某一化学基团修饰特定氨基酸残基。还有一种化学修饰是化学重排氨基酸侧链,有的时候是化学重排肽链骨架。例如一些水母(jellyfish)产生的绿色荧光蛋白,其肽段Ser-Tyr-Gly氧化后自动重排产生荧光(图2.68)。这个蛋白质作为胞内标记物在科研领域有很大用途。

图2.68 GFP的化学重排。(A)绿色荧光蛋白的结构。Ser-Tyr-Gly序列的氧化和化学重排是GFP产生荧光的原因。(B)线虫胚胎四细胞期的荧光纤维图谱,其PIE-1蛋白质用GFP标记。细胞用线标出。只有胚胎顶部那个表细胞达GFP。这个细胞将来会发育成生殖细胞。

还有一些蛋白质必须经过断裂或截断才执行其生物功能。胰脏合成的消化酶是没有酶活性的前体,储存于胰脏。当这些前体释放到小肠,肽链发生断裂转化成有活性的蛋白酶。血液凝固也与此相同。肽链断裂将可溶性的纤维蛋白原转化成不溶性的纤维蛋白。有些多肽激素,如促肾上腺皮质激素就是一条激素前体多肽链断裂后的产物。类似地,很多病毒蛋白质也是大的多蛋白前体发生断裂生成的。我们还会遇到更多蛋白修饰和蛋白裂解才能执行其生物功能的实例。事实上,这些发现有助于解释蛋白质功能多样性、精确性、以及蛋白质功能调节。

总结

蛋白质结构可以用四个水平来描述。一级结构就是蛋白质的氨基酸序列。二级结构是多肽链局部区域氨基酸残基的构型。三级结构是多肽链的整体折叠情况。四级结构是多个多肽链之间相互作用,这种相互作用形成多亚基复合物。 2.1 构建蛋白质的单体是20种氨基酸

蛋白质是氨基酸的线性聚合物。每个氨基酸有一个中心碳原子。这个碳原子与一个氨基、一个羧基、一个侧链和一个氢原子结合。除了甘氨酸外,所有氨基酸的中心碳原子是不对称的,有手性。天然蛋白质的氨基酸都是L-型。20种氨基酸的侧链基团差异很大,这些侧链在大小、形状、和功能基团有无方面有很大差异。可以将氨基酸分为下列几类。(1)侧链为脂肪链的氨基酸,有甘氨酸、丙氨酸、颉氨酸、亮氨酸、异亮氨酸、甲硫氨酸、和脯氨酸。(2)侧链有芳香环的氨基酸,包括苯丙氨酸、酪氨酸、和色氨酸。(3)侧链带有羟基的氨基酸,有丝氨酸和苏氨酸。(5)侧链含有酰胺的氨基酸,包括天冬酰胺和谷氨酰胺。(6)侧链含有碱性的氨基酸,包括赖氨酸、精氨酸和组氨酸。(7)侧链带有酸性的氨基酸,包括天冬氨酸和谷氨酸。这种分类有一定的主观性,还有其他的分类方案。 2.2 一级结构:用肽键连接的氨基酸顺序

多肽链氨基酸之间的连接是肽键。肽键就是一个氨基酸的羧基与下一个氨基酸的氨基宿合形成的酰胺键。肽键有几个重要特征。(1)肽键能耐受水解,所以蛋白质在动力学上很稳定。(2)肽键是平面结构,因为C-N键具有双键特性。(3)各个肽键既能提供氢键供体(NH),又能提供氢键受体(C=O)。肽链骨架基团之间形成氢键是蛋白质结构的独特性质。(4)肽键不带电荷,因此多肽链能紧密压缩成球状并将蛋白质大量骨架包埋于球状蛋白内部。由于蛋白质是氨基酸的线性聚合物,因此蛋白质可以用氨基酸序列表示。在书写这种序列时,从N-端向C-端书写。

?????二级结构:多肽链能折叠成规则结构如??螺旋、??片层、拐弯和环状结构。

两个主要的二级结构元件是??螺旋和??片层。在??螺旋中,多肽链扭曲成高度压紧的棒状结构。一个氨基酸的C=O基与下游第4位氨基酸残基的NH基形成氢键。??片层的多肽链几乎完全伸展。两个或更多肽段间NH和C=O形成氢键结合在一起形成??片层。??片层可以示同向平行、反向平行、或混合型。

2.4 三级结构:水溶性蛋白质折叠成具有疏水核的致密结构。

各个多肽链呈现致密非对称结构。水溶性蛋白三级结构通常具有下列特征:(1)蛋白质内部氨基酸侧链是疏水的;(2)蛋白质表面氨基酸多数是能够与水环境相互作用的亲水氨基酸。水溶性蛋白质三级结构形成的驱动力是内部残基之间的疏水作用。有些蛋白质处于疏水环境,如膜蛋白。这类蛋白质疏水性氨基酸残基和亲水性氨基酸残基分布与水溶性蛋白质刚好相反。其疏水氨基酸处于蛋白分子表面,与疏水环境相互作用。而亲水氨基酸臵于蛋白质内部。 2.5四级结构:数个多肽链组装成多亚基复合物结构

蛋白质有一个以上多肽链有四级结构。每个多肽链是一个亚基。四级结构简单的是两个一致亚基聚合,而复杂的四级结构可以是几十种不同亚基聚合所形成的复合物。多数情况下亚基之间缺乏共价键。

2.6 蛋白质的氨基酸序列决定蛋白质的三维结构

蛋白质的氨基酸序列能够确定蛋白质的三维结构。因此氨基酸序列实际上决定了蛋白质的其它性质。有些蛋白质在变性条件下彻底变性,在折叠蛋白质稳定的条件下变性蛋白质也能有效地复性。DNA序列决定了蛋白质的氨基酸序列。由于特定氨基酸序列的蛋白质能够自动折叠成特定的三维结构,一维的序列信息通过蛋白质转化成三维的空间信息。蛋白质折叠是一个高度协调的过程。完全不折叠的变性结构和完全折叠的天然结构之间的折叠中间体不积累。

共价修饰进一步丰富了蛋白质的多样性。这种修饰能够添加20种氨基酸不具备的功能基团。有些修饰在调节蛋白质的活性方面非常重要。蛋白质分子就是通过调节蛋白结构稳定性、多样性、和化学反应性来执行生物体大多数关键功能。

附录IX: 蛋白分子结构可视化。

科学家们已经建立了确定蛋白质结构的有效技术(第3章)。多数情况下,这些技术能够确定一个蛋白质分子内成千上万个原子的位臵。在蛋白质分子中,每个原子都有自己的x, y,和z值。将各个原子的x, y,和z值编辑成蛋白质结构的数据文件,收入蛋白质数据库(http://www.rcsb.org/pdb/) 。你可以从这个网站下载这些数据。一个蛋白质分子含有成千上万的原子。将各个原子的结构都描绘出来也是一个重大挑战。现在有几个方案描绘蛋白质分子的结构。各种描绘方案都有各自的优缺点。本书你会经常碰到的结构表示方法有空间填充模型、球-棒模型、骨架模型、和绸带模型。如果合适,我们会在注释部分介绍蛋白质分子中那些具有重要意义的结构特征。

空间填充模型

空间填充模型是最接近实际的结构模型。每个原子用一个球表示。球的大小与该原子的范德华半径正相关。化学键没有明确标出。但是如果原子间的距离小于两个原子范德华半径之和时用球体间界面表示化学键。要绘出所有原子的位臵,包括多肽骨架原子和侧链原子。图2.69就是溶菌酶的空间填充模型。

空间填充模型给我们的印象是蛋白质结构内几乎没有空余的地方,有很多原子处于范德华相互作用状态。在显示蛋白质从一种构型转化成另一种构型时,空间填充模型非常有用。但是,从空间填充模型很难看出蛋白质分子的二级结构和三级结构。由于很多蛋白质的空间填充模型外形相似,仅仅依靠空间填充模型很难将一种蛋白与另一种蛋白区分开来。

图2.69 溶菌酶的空间填充模型。看看原子真拥挤啊,没有剩余的空间。除了氢原子外外,所有原子都被显示出来(通常删除氢原子,因为x-晶体衍射没有测定氢原子位臵,而且删除氢原子有助于图谱清晰)。

球-棒模型

球-棒模型没有空间填充模型真实。实际的原子所占空间由原子的范德华半径决定,比球棒模型的原子大得多。但是,球棒模型中化学键用棒特意标示出来(图2.70),因此你很容易看到化学键的排布。球棒模型在显示蛋白质原子的复杂结构方面比空间填充模型清晰。但是描绘球-棒模型很复杂以致不易看出??螺旋和潜在的结合位点。

由于空间填充模型和球棒模型在原子水平上描述蛋白质结构,因此很难看出蛋白质相应的结构特征。更为简略的方式,如骨架模型和绸带图谱,用来描述蛋白质结构。用这种方式描绘蛋白质结构时,大多数原子甚至所有原子没有绘制出来。

图2.70 溶菌酶的球棒模型。在这个结构模型中也删除氢原子。

骨架模型

骨架模型仅显示多肽链的骨架原子或只显示各氨基酸的??碳原子。线段将相邻氨基酸的两个??碳原子连接起来(图2.71)。骨架只显示??碳原子,没有标出氨基酸残基的其他原子。

骨架模型表示蛋白质全貌的效果比空间填充模型和球棒模型好得多。但是骨架模型也很难观察到蛋白质的二级结构。

图2.71 溶菌酶的结构图。

绸缎图

绸缎图的草图化水平更高。绸带图通常用来强调蛋白质结构的若干特征,如??螺旋,??链(带箭头的宽带),环(细线),能清晰地看出蛋白质的折叠类型(图2.72)。绸带图能看出蛋白质全貌和蛋白质分子内的二级结构。进化相关蛋白绸带图结构类似,而进化无关蛋白的绸带图明显不同。

缠绕绸带用来表示??螺旋。但是膜蛋白的结构比较复杂,用圆柱表示螺旋绸带。这种方式描述的跨膜??螺旋易于识别。

记住绸带图的空余处也是充填满了原子的(如同前面空间填充模型所显示的),蛋白质内几

乎没有空余之处。绸带图谱的空余处可以用来标示蛋白质结构的其他特征。在绸带图中也可以用球棒结构模型或空间填充模型标出活性位点、底物、化学键、和其他结构成分(图2.73)。

图2.73 溶菌酶的绸带结构图。用球棒显示4个二硫键和功能上重要的天冬氨酸残基。

本文来源:https://www.bwwdw.com/article/yb2o.html

Top