外显子组测序信息分析.pptx
- 文档编号:18744894
- 上传时间:2023-10-26
- 格式:PPTX
- 页数:32
- 大小:2.03MB
外显子组测序信息分析.pptx
《外显子组测序信息分析.pptx》由会员分享,可在线阅读,更多相关《外显子组测序信息分析.pptx(32页珍藏版)》请在冰点文库上搜索。
外显子组测序在医学研究中的应用,一、外显子组测序技术简介,外显子组序列仅占全基因组序列的1%左右,与人类85%致病基因突变相关。
与全基因组测序相比,外显子组测序不仅费用较低,而且测序覆盖度更深,数据准确性更高。
外显子测序是指利用序列捕获技术将全基因组外显子区域DNA捕捉并富集后,再进行高通量测序的基因组分析方法。
二、外显子组测序流程,三、外显子组测序信息分析流程,主要信息分析内容归类,3.1、数据过滤与评估3.2、整体质量评估3.3、SNP检测与注释3.4、InDel检测与注释3.5、高级分析,3.1、数据过滤与评估,过滤接头。
对含接头的reads去除接头序列。
一条reads上N(未能确定出具体的碱基类型)的比例大于5%,则过滤掉该reads。
过滤低质量reads,过滤掉Q3085%reads。
3.1.1、原始数据过滤,3.1.2、测序数据统计与评估,测序质量值分布图,碱基含量分布图,3.2、整体测序质量评估,3.2.1、测序深度统计,注:
横坐标代表测序深度,纵坐标代表目标区域上对应深度的碱基数占总碱基数的百分比。
目标区域的单碱基分布近似服从泊松分布。
3.2.2、外显子捕获统计,当比对到参考基因组目标区域的数据量在60%之上,认为外显子捕获效率合格。
3.2.3、染色体覆盖深度分布,注:
横坐标为染色体长度,纵坐标为覆盖深度取对数。
3.3、SNP检测及注释,3.3.1、SNP检测,SNP的检测主要使用GATK软件工具包实现。
3.3.2、SNP注释,3.3.3、突变特征,突变频谱图,注:
横坐标为不同类型的突变,纵坐标为不同类型突变对应的频率。
3.3.3、突变特征,突变位点上下文碱基偏好性,注:
横坐标为突变位点上下文的碱基位置,0为SNP突变位点,负数代表突变位点前的碱基,正数代表突变位点后的碱基,纵坐标为不同碱基对应的比例。
从图上可以看出,不同类型的SNP突变上下文具有不同的碱基偏好性。
3.4、InDel检测及注释,3.4.1、InDel检测,3.4.1、InDel注释,3.5、高级分析,3.5.1、基因融合,注:
最外圈表示人基因组及基因组上基因分布情况;文字代表发生基因融合的基因ID;红色线条代表染色体间基因融合;绿色线条代表染色体内基因融合。
3.5.2、氨基酸替换预测,注:
Codons:
密码子的变化情况;Substitution:
氨基酸的替换信息;SNPType:
SNP的类型;Prediction:
预测结果(damaging/tolerated),TOLERATED表示这个突变是可以容忍的,即对蛋白质功能没有影响或影响很小,DAMAGING表示突变是有害的,即对蛋白质功能有较大影响;Gene:
发生替换所在的基因。
3.5.3、样品间差异表达基因COG分类统计,COG数据库是基于细菌、藻类、真核生物的系统进化关系构建得到的,利用COG数据库可以对基因产物进行直系同源分类。
注:
横坐标为COG各分类内容,纵坐标为基因数目。
在不同的功能类中,基因所占比例多少反映对应时期和环境下代谢或者生理偏向等内容,可以结合研究对象在各个功能类的分布作出科学的解释。
差异基因GO注释聚类图,topGO有向无环图,3.5.4、样品间差异表达基因GO分类统计,差异基因KEGG通路示意图,3.5.5、样品间差异表达基因KEGG注释,四、外显子组测序的应用思路,4.1WES找寻孟德尔疾病致病基因思路,全外显子测序Whole-exomesequencing,分析及预测候选基因突变致病性Analysisandpredictcandidatecausativevariats,生物学功能研究Functionalresearch,在多个家系或散发病例中进行突变筛查研究Mutationscreening,遴选和采集病例和家系Samplescollection,4.2WES肿瘤研究上的思路,4.3WES在复杂疾病上的研究的思路,Biomarker,生物技术服务专家,
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 外显子组测序 信息 分析