通过Blast数据库对抗EGFR纳米抗体、单克隆抗体 进行生物信息学分析

更新时间:2023-12-27 01:23:01 阅读量: 教育文库 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

生物信息学作业

通过Blast数据库对抗EGFR纳米抗体、单克隆抗体

进行生物信息学分析

学院(系):生命科学与技术

专业:生物化工 学号: 学生姓名:

完成日期: 2015-11-14

一.研究背景

表皮生长因子受体(EGFR)是酪氨酸激酶受体(RTK)ErbB家族的一员。生长因子受体与EGF家族蛋白结合后,将会被激活。研究表明,EGFR参与许多不同种类的肿瘤产生及发展转移的过程。EGFR蛋白在人类肿瘤细胞中过属于表达蛋白,在体内、体外实验均表明,EGFR蛋白可以引起肿瘤细胞的转移。EGFR作为药物作用靶点也成为目前抗肿瘤分子靶向研究中关注最为广泛、研究最为深入、最有前途的治疗靶点之一。

目前,针对抗EGFR作用的研究主要集中在EGFR的单克隆抗体和旨在阻断EGFR介导的信号转导通路的小分子蛋白酪氨酸激酶抑制剂上。骆驼科动物体内存在天然的缺失轻链的功能性抗体,此类抗体只含重链,克隆其可变区得到的仅含重链可变区的单域抗体称为纳米抗体。相较之传统单克隆抗体高成本、低稳定性等局限性,纳米抗体分子量很小且缺少Fc段,不会引起人体的免疫反应,生物相容性好,具有很强的组织穿透能力,能够进入致密的实体瘤组织,甚至能穿透血脑屏障发挥功效;而游离的纳米抗体也能被人体迅速清除,在医学领域具有得天独厚的优势。本实验室致力于通过基因工程学的方法表达抗表皮生长因子受体纳米抗体(nanobody of pidermalgrowth factor receptor,EGFRnb),从而捕获肿瘤细胞,实现体内肿瘤细胞的清除或是靶向给药。

本组目前使用的抗EGFR纳米抗体PMP9G8序列为专利序列(附录1),在构建质粒的过程中对基因序列进行了密码子优化(附录2),对大肠杆菌密码子偏好性进行分析,减少了密码子兼并性。由于该种EGFR纳米抗体为商品蛋白,对其结构没有详尽的研究,所以在蛋白表达、纯化的过程中存在一定的盲目性;在今后的研究中我们试图对纳米抗体进行基因突变后筛选以提高其亲和力,但是因为没有对氨基酸位点功能进行详细的分析,所以突变位点的选择也存在一定的盲目性。因此,本文试图通过Blast序列比对为切入点,对纳米抗体PMP9G8的结构特点、功能位点、引物设计等方面进行分析。同时,选取专利

CN200510024158.3.中的人源化EGFR单克隆重链抗体3C6序列(附录3),与鼠源胚系基因进行比对分析,加深对于基因重排机理的了解。

图1.EGFR结构模式图

二. 纳米抗体PMP9G8序列比对分析

将PMP9G8氨基酸序列输入BlastP搜索框中,搜索结果显示有12条高相似、全覆盖的氨基酸序列。名为Chain B, Nanobody/vhh Domain 9g8 In Complex With The Extracellular Region Of Egfr的序列能够与PMP9G8序列100%覆盖、且100%相似。这个序列能与EGFR胞外域结合形成复合体,由此可知纳米抗体PMP9G8也具有与EGFR结合的能力。VHH-9g8 domain序列中共有130个氨基酸,前127个与目的纳米抗体全部相同(图2),所以通过VHH-9g8 domain对序列进行分析,能够进一步了解纳米抗体PMP9G8的结构信息。

图2.纳米抗体PMP9G8序列比对分析结果

图3.纳米抗体PMP9G8序列与VHH-9g8 domain序列比对结果

图4. VHH-9g8 domain序列信息

组氨酸标签

EGFR胞外域蛋白

VHH-9g8domain与EGFR的结合位点 VHH-9g8 domain的N端

VHH-9g8 domain的C端

图5. VHH-9g8 domain与EGRF胞外域结合形成复合体的3D结构

VHH-9g8 domain序列来源为Lama,纳米抗体序列也是从Lama体内筛选得到的,两者同源。由图3可知,VHH-9g8 domain中含有8个β折叠(图中红框标注),蛋白的N端1-8号氨基酸为β折叠,纳米抗体序列C端对应的是VHH-9g8 domain的第127号位,不在β折叠区域内,为无规则卷曲的形状,比较自由。由3D结构(图4)可知,N端距离抗原结合位点比较近,所以在表达纯化加入组氨酸标签时不能够加在N端,否则容易影响抗体活性。如图显示VHH-9g8 domain的6个组氨酸标签也加在了C端上(图中绿框标注),所以在纳米抗体PMP9G8纯化时标签也应该加在C端以保证活性。

VHH-9g8 domain的第22位和第96位的两个半胱氨酸形成内部二硫键(图中蓝框标注),可以由此推测纳米抗体序列也在这两个位置上形成二硫键。这个二硫键对纳米抗体结构的稳定性至关重要,如果二硫键没能形成或者正确折叠,蛋白将会形成包涵体而失活。因此基因突变筛选亲和力更高的纳米抗体时不能对这两个位点进行突变。而VHH-9g8 domain的其他保守区域位点与纳米抗体序列相同,因此在下文中将直接对纳米抗体序列分析。 三.纳米抗体蛋白保守结构域分析结果

图5.纳米抗体PMP9G8保守结构域分析

如图所示,分析结果预测该纳米抗体属于免疫球蛋白超家族(Ig superfamily),同时该纳米抗体的特定比对分析结果显示其与名为cd04981的人类重链抗体

(IgV-H)显示高度的相似性,因此在IgV-H保守位点中的一些特征氨基酸也体现在了该纳米抗体序列中:

1)在纳米抗体蛋白序列中,29、43、47、95、117、118六个氨基酸在IgV-H保守位点中参与形成异质二聚体接触界面,是多肽结合位点。因此推测该二聚体可能也有类似性质。在表达纯化过程中要特别注意二聚体的形成,通过凝胶筛分等方法将二聚体去除;同时说明该纳米抗体也可以与其他小分子进行连接,具有应用于靶向给药的潜力。

2)根据图中特征可变区氨基酸的位置可以推测该纳米抗体的3个高度可变区CDR为24-32、72-78、114-116位氨基酸。原则上是纳米抗体的可变区位点与抗原相结合,但是图中显示,位于框架区的第50位氨基酸也会结合抗原,而框架区主要决定了纳米抗体的构象,因此可以推测此种抗体的亲和力与其构象关系密切,因此在制备时要避免形成包涵体,破坏抗体的天然构象,失去抗原结合能力。在后期进行纳米抗体基因改造进时要尤其着重考虑第50位氨基酸突变可能会带来的影响。

3)图中显示PMP9G8序列的9、11、124、126、122位氨基酸参与抗体内部结构之间的相互作用,这几个氨基酸也处于预测的框架区中。

四.利用Primer-Blast对纳米抗体序列进行引物设计及特异性分析

将本组经过密码子优化的纳米抗体基因序列输入PCR Template中,将上游引物插入位点设置为基因1-50位,下游引物插入位点设置为基因300-385位。为了保证模板特异性,增加了引物对无关模板mismatches的数量,这样与无关模板匹配的特异性不足的引物会被筛选出去。

图6. 增加引物的扩增特异性

服务器计算后(如图),设计出了10对特异性非常强的引物,这些引物在扩增的过程中不会对其他非目的片段进行扩增。主要原因是因为本纳米抗体序列经过了密码子优化,针对宿主菌大肠杆菌的密码子进行偏好分析,减少稀有密码子促进表达的同时也减少了密码子的兼并性,与序列其他基因片段差异明显,因此设计出的引物可以特异性识别固定的位点开始扩增,不会扩增错误位点。

引物特异性很强

图7.纳米抗体PMP9G8引物设计结果

用未经过密码子优化的EGFR单克隆抗体重链可变区序列3C6进行引物设计结果如下:结果发现数据库无法优化出特异性强的引物,不仅在设计位点处与模板相同,与模板链内部其他位置同源性大于70%,因此很有可能会扩增出错误或是不完整的模板片段。为了验证这一结果,登录Saccharomyces GENMOE DATABASE(SGD)进行在线引物设计,也无法设计出具有特异性的引物。这两个基因序列引物设计的结果说明了密码子优化在PCR中的重要作用。 上游引物与模板内部大量同源

图8.单克隆抗体VH区3C6引物设计结果

引物特异性不够强

五.利用IgBlast对单克隆抗体3C6序列进行胚系基因比对

IgBlast可以用于免疫球蛋白序列分析,基于数据库IMGT中不同物种的胚系基因进行比对。由于纳米抗体来源为羊驼,胚系基因数据库不含有该物种,因此继续以专利中的单克隆抗体重链可变区3C6为研究对象。进入IgBlast界面,输入序列,选择物种为“鼠源”,结果如图所示。

(1) (3) (2)D区 J区 V-D连接区 D-J连接区

图9.将单克隆抗体VH区3C6与胚系基因进行比对

抗体重链可变区是由V、D、J三种基因片段重排产生的,如图中(1)所示,与抗体V基因片段相似度最高的的是鼠源胚系基因IGHV2-6-7*01,以及与D、J片段相似最高的是IGHD2-5*01序列、IGHJ2*01序列。因此可以推测:IGHV2-6-7*01、IGHD2-5*01、IGHJ2*01三个胚系基因片段重排形成了鼠源的抗

EGFR单克隆抗体可变区序列,在此基础上进行人源化替换了一些基因位点,将鼠源抗体改造为人源抗体。

图中(2)显示了抗体基因的比对结果,可以发现构成FR1、CDR1、FR2、CDR2、FR3的基因全部为V基因片段,这是由于V基因片段由2个编码区组成:一个编码区编码大部分信号序列,另一个编码区编码信号序列包括互补决定区1和2。D基因片段编码重链可变区大部分CDR3,J基因片段编码CDR3除D基因片段编码外的其余部分和FR4(C区、D区在图中标注)。图中未显示CDR3与FR4的具体区域。

由图中(3)可知抗体序列中存在V-D连接区、D-J连接区,(连接区在图中标注)这两段基因不是特异的,在其他的抗体重排过程中也可能会出现。胚系基因比对只提供了抗体基因片段可能的来源,由于连接区的存在,如果想要具体划分CDR3和FR4需要进一步通过clustalX进行更大范围的比对分析。 六.总结

经过生物信息学可知,纳米抗体PMP9G8内部具有8个β折叠,同时含有一个二硫键,为了保证纳米抗体的结合活性,组氨酸标签应加在C端。纳米抗体PMP9G8内部有非常多的保守位点,框架区的保守位点参与纳米抗体构象组成,因此在基因突变时要着重考量这些氨基酸突变会对纳米抗体带来的影响。在引物设计时。将经过密码子优化和未优化的序列进行对比,说明了序列密码子优化的重要性。同时通过对单克隆抗体重链可变区3C6的胚系基因比对,了解了该抗体基因的可能来源及重排情况。

如果想要进一步了解纳米抗体PMP9G8,还应该联合使用更多的生物信息学软件,对其理化性质特点进行分析。

附录1:抗EGFR纳米抗体PMP9G8氨基酸序列

EVQLVESGGGLVQAGGSLRLSCAASGRTFSSYAMGWFRQAPGKEREFVVAINWSSGSTYYADSVKGRFTISR DNAKNTMYLQMNSLKPEDTAVYYCAAGYQINSGNYNFKDYEYDYWGQGTQVTVSS

附录2:密码子优化后抗EGFR纳米抗体PMP9G8基因序列

CCATGGCCGAATTCGAAGTTCAGCTGGTTGAATCTGGTGGTGGTCTGGTTCAGGCTGGTGGTTCTCTGCGTCTGTCTTGCGCTGCTTCTGGTCGTACCTTCTCTTCTTACGCTATGGGTTGGTTCCGTCAGGCTCCGGGTAAAGAACGTGAATTTGTTGTTGCTATCAACTGGTCTTCTGGTTCTACCTACTACGCTGACTCTGTTAAAGGTCGTTTCACCATCTCTCGTGACAACGCTAAAAACACCATGTACCTGCAGATGAACTCTCTGAAACCGGAAGACACCGCTGTTTACTACTGCGCTGCTGGTTACCAGATCAACTCTGGTAACTACAACTTCAAAGACTACGAATACGACTACTGGGGTCAGGGTACTCAGGTTAC

附录3:人源化EGFR单克隆抗体重链可变区3C6基因序列

CAGGTGCAGCTGAAGGAGTCCGGCCCCGGCCTGGTGGCCCCCTCCCAGTCCCTGTCCATCACCTGCACCGTGTCCGGCTTCTCCCTGACCAACTACGGCGTGCACTGGGTGCGCCAGCCCCCCGGCAAGGGCCTGGACTGGCTGGGCGTG ATCTGGTCCGGCGGCAACACCGACTACAACACCCCCTTCACCTCCCGCCTGAACATCTCCAAGGACGGCTCCAAGTCCCAGGTGTTCCTGCGCATGTACTCCCTGCAGACCGACGACACCGCCCGCTACTACTGCGCCCGCGCCCTGACCTACTACGACTACGAGTTCGCCTACTGGGGCCAGGGCACCCTGGTGACCGTGTCCTCC

本文来源:https://www.bwwdw.com/article/3j0x.html

Top