《生物信息学》上机作业.docx
- 文档编号:14785932
- 上传时间:2023-06-27
- 格式:DOCX
- 页数:10
- 大小:617.71KB
《生物信息学》上机作业.docx
《《生物信息学》上机作业.docx》由会员分享,可在线阅读,更多相关《《生物信息学》上机作业.docx(10页珍藏版)》请在冰点文库上搜索。
《生物信息学》上机作业
《生物信息学》上机作业
题目:
对人血红蛋白(HBA1)编码基因序列的生物信息分析
引言
血红蛋白又称血色素,是红细胞的主要组成部分,能与氧结合,运输氧和二氧化碳。
血红蛋白含量能很好地反映贫血程度。
血红蛋白是高等生物体内负责运载氧的一种蛋白质,具有四聚体蛋白质四级空间结构。
人体内的血红蛋白由四个亚基构成,分别为两个α亚基和两个β亚基,每个亚基由一条肽链和一个血红素分子构成。
肽链在生理条件下会盘绕折叠成球形,把血红素分子抱在里面,这条肽链盘绕成的球形结构又被称为珠蛋白。
每1Hb分子由1个珠蛋白和4个血红素(又称亚铁原卟啉)组成。
每个血红素又由4个吡咯基组成一个环,中心为一铁原子。
每个珠蛋白有4条多肽链,每条多肽链与1个血红至少连接构成Hb的单体或亚单位。
Hb是由4个单体构成的四聚体。
不同Hb分子的珠蛋白的多肽链的组成不同。
成年人Hb(HbA)的多肽链是2条α链和2条β链,为α2β2结构。
胎儿Hb(HbF)是2条α链和2条γ链,为α2γ2结构。
出生后不久HbF即为HbFA所取代。
多肽链中氨基酸的排列顺序已经清楚。
血红素的Fe2+均连接在多肽链的组氨基酸残基上,这个组氨酸残基若被其它氨基酸取代,或其邻近的氨基酸有所改变,都会影响Hb的功能。
可见蛋白质结构和功能密切相关。
1正文
1.1NCBI上对相关核苷酸序列的查找
首先运用NCBI数据库对相关的核弹酸序列进行查找,得到如下FASTA格式结果序列:
图1.1人体血红蛋白亚基1(HBA1),mRNA,NM_000558.5序列
1.2BLAST运行及其结果
图1.2与已知序列具有一定相似度的序列
图1.3基因对比结果
从上述两张图可以看出:
前三个对比序列与第7个对比序列到第17个对比序列所引用的核苷酸序列相似度高达100%,第4个对比序列到第6个对比序列与所引核苷酸序列相似度为99%。
在诸多相似的其他序列之中,选取以下三个相似度不同的序列做细致的比对,结果如下:
图1.4黑猩猩血红蛋白亚基1(HBA1)mRNA
此为与所引序列比对相似度高达99%的——黑猩猩血红蛋白亚基1(HBA1)mRNA:
此序列来源于黑猩猩(猩猩)生物。
编号NM_001042626。
图1.5人类血红蛋白亚基2(HBA2),mRNA
此为与所引序列比对相似度为100%的——人类血红蛋白亚基2(HBA2),mRNA序列:
此序列来源于智人(人类)生物编号为NM_000517。
图1.6东非狒狒血红蛋白,亚基1(HBA1),mRNA
此为与所引序列比对相似度为98%的——东非狒狒血红蛋白,亚基1(HBA1),mRNA序列:
此序列来源于东非狒狒(狒狒)生物。
编号NM_001168816.
1.3BLASTX运行及其结果
通过BLASTX,将由NCBI获得的基因:
人体血红蛋白亚基1HBA1基因,NM_000558.5,序列进行翻译为蛋白质后再次进行比对,结果如下:
图1.7BLASTX运行结果
图1.8蛋白质比对结果
由运行结果可知,前7个序列与已知人体血红蛋白亚基1HBA1基因,部分cds基因序列翻译得到的蛋白质有高度相似性。
其得分均在300以上,这些蛋白具有高度同源性。
2其他软件的运行及其结果
2.1ClustalW运行及其结果
为了比较不同物种间的亲缘关系,以及不同血红蛋白亚基之间的相似度,我选取了BLASTN运行结果前十项与已知人体血红蛋白亚基1HBA1基因序列进行比对,运行了ClustalW运行,得到其结果如下:
图2.1ClustalW运行结果phlogeneticTree图谱
由phlogeneticTree图谱可知:
AK223392.1序列与BC005931.1序列、BC032122.2序列与XM_011960067.1序列、XM_024233299.1序列与XM_030924410.1序列、XM_010381857.2序列与NM_000517.6序列之间的亲缘关系最近;
而NM_001042626.1序列与BC050661.1序列之间亲缘关系较近,其余各序列之间亲缘关系较远。
图2.2ClustalW运行结果GuideTree图谱
由GuideTree图谱可知:
XM_011960067.1序列与NM_001042626.1序列亲缘性最高;同理可知:
XM_010381857.2序列与AK223392.1序列、XM_030924410.1序列与BC005931.1序列亲缘关系最近;
NM_000558.5序列与BC005931.1序列间、XM_024233299.1序列与BC032122.2序列之间亲缘关系较近;其余序列之间亲缘关系较远。
图2.3Jalview运行结果
2.2MEGA4.0运行及其结果
利用邻域加入法来推断其进化历史,通过对生物序列的研究来推测物种的进化历史。
通过DNA序列,蛋白质序列,蛋白质结构等来构建系统发育树建立结构进化树。
使用邻接法构建系统发生树。
通过MEGA4.0的运行得到如下进化树:
图2.4MEGA4.0运行结果
结论
由人血红蛋白(HBA1)编码基因序列与其相似序列比对分析可知:
人血红蛋白亚基1与血红蛋白亚基2具有高度同源性,可推知血红蛋白可能最初就是从同一种蛋白质发生基因突变,产生的两种不同亚基的血红的蛋白,所以人体的血红蛋白由四个亚基组成,两个α亚基,两个β亚基。
并且人体血红蛋白基因序列和人亲缘关系较近的黑猩猩、狒狒等灵长类动物体内的部分基因具有高度的相似性。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 生物信息学 生物 信息学 上机 作业