欢迎来到冰点文库! | 帮助中心 分享价值,成长自我!
冰点文库
全部分类
  • 临时分类>
  • IT计算机>
  • 经管营销>
  • 医药卫生>
  • 自然科学>
  • 农林牧渔>
  • 人文社科>
  • 工程科技>
  • PPT模板>
  • 求职职场>
  • 解决方案>
  • 总结汇报>
  • ImageVerifierCode 换一换
    首页 冰点文库 > 资源分类 > PPTX文档下载
    分享到微信 分享到微博 分享到QQ空间

    高通量测序技术PPT文档格式.pptx

    • 资源ID:809768       资源大小:61.91MB        全文页数:62页
    • 资源格式: PPTX        下载积分:10金币
    快捷下载 游客一键下载
    账号登录下载
    微信登录下载
    三方登录下载: 微信开放平台登录 QQ登录
    二维码
    微信扫一扫登录
    下载资源需要10金币
    邮箱/手机:
    温馨提示:
    快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。
    如填写123,账号就是123,密码也是123。
    支付方式: 支付宝    微信支付   
    验证码:   换一换

    加入VIP,免费下载
     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    高通量测序技术PPT文档格式.pptx

    1、,对于每个物种来说,基因组包含了整个物种的遗传信息。测序技术能够真实地反映基因组DNA上的遗传信息,进而全面地揭示基因组的复杂性和多样性。从根源上寻找导致蛋白功能差别的位点为物种鉴定、临床诊断和司法鉴定提供基础疾病预测研究基因间的相互作用揭示物种进化的历程生命之树,Three basic problems of Sequencing,如何读到DNA片段的碱基信号?如何读到DNA片段的连续碱基信号?如何读到一批DNA片段的连续碱基信号?,通过扩增来增加DNA的数量从而放大信号有足够多的DNA合成反应中止于同一个碱基,让合成反应的中止依次出现在每个碱基上,在不同模板的反应间建立有效的隔离方式,测序

    2、技术的发展历程,(Biomarker 2013),测序技术的发展历程,(Guohui 2013),测序技术原理及过程,Sanger/454/SOLID/Illumina/PacBio,第一代测序技术,最早的测序技术源于Robert Holley 研究小组1965 年对酵母苯丙氨酰-tRNA 的77 个核苷酸全序列的测定,Holley 本人也因此而获得了1968 年的诺贝尔生理医学奖。,20 世纪70 年代后期,第一代快速有效的DNA 测序技术体系终于建立,其中最为著名的是 Sanger 的“双脱氧末端终止法”。,Robert W.Holley,Frederick Sanger,ABI 3730

    3、,(Qiu 2006),sanger法测序反应原理,原料:DNA聚合酶 DNA模板 单链寡核苷酸引物 dNTP ddNTP with fluorochromes,sanger法测序反应原理,(Biomarker 2013),sanger法测序优缺点,96孔板或384孔板的一个孔,第二代测序技术,焦磷酸测序法Pyrosequencing,边合成边测序Sequencing By Synthesis,SBS,边连接边测序Sequencing By Ligation,SBL,400bp,2*150bp,2*75bp,400-600Mb/10h,1.5T/run(3.5d),300Gb/run(7d),

    4、基于焦磷酸测序法的454测序,T、A、C、G依次循环进入PTP板,如果发生碱基配对,就会释放一个焦磷酸。,这个焦磷酸在ATP硫酸化酶和萤光素酶的作用下将萤光素氧化成氧化萤光素,同时释放出光信号。,基于焦磷酸测序法的454测序,基于边连接边测序(SBL)的SOLID测序,基于边连接边测序(SBL)的SOLID测序,基于边连接边测序(SBL)的SOLID测序,基于边连接边测序(SBL)的SOLID测序,基于边连接边测序(SBL)的SOLID测序,基于边连接边测序(SBL)的SOLID测序,基于Solexa的Illumina Hiseq测序,Solexa是一种基于边合成边测序技术(Sequencin

    5、g-By-Synthesis,SBS)的新型测序方法。通过利用单分子阵列实现在小型芯片(Flow Cell)上进行PCR反应。,3羟基经过特殊化学基团的保护,在聚合酶延伸反应能起类似于ddNTP 的作用,使每次测序反应只有单个碱基被延伸,且其信号可以通过类似传统Sanger 法中荧光检测方法检测,每次反应完成后,用特异的酶将修饰基团去除,便可以进行下一个碱基的测序,基于Solexa的Illumina Hiseq测序,Parallel sample processing,Automated clustergeneration,Automated sequencing,SIMPLIFIED SAM

    6、PLE PREP,cBot CLUSTER GENERATION,HiSeq 2000/2500 SEQUENCING,基于Solexa的Illumina Hiseq测序,基于Solexa的Illumina Hiseq测序,基于Solexa的Illumina Hiseq测序,基于Solexa的Illumina Hiseq测序,DNA(0.1-1.0 ug),Single molecule array,Sample preparation,Cluster growth,Sequencing,基于Solexa的Illumina Hiseq测序,基于Solexa的Illumina Hiseq测序,S

    7、ingle-Read Sequencing(SR,单向测序),Paired-End Sequencing(PE,双向测序),只检测基因片段一端的序列信息。,检测基因片段的两端序列信息。,基于Solexa的Illumina Hiseq测序,Cluster Amplification扩增后的簇,Single-Read,P7 Linearization(fpg)线性化,OH,Paired-End Read,基于Solexa的Illumina Hiseq测序,Barcode/Index,基于Solexa的Illumina Hiseq测序,1,2,Image acquisition,第三代测序技术简介P

    8、acBio 单分子测序技术,第三代测序技术简介PacBio 单分子测序技术,Reads&Contigs,Contig,Contigs,N,N/2,Contig N50,PacBio 可以解决NGS哪些困扰?,PacBio 可以解决NGS哪些困扰?,此外,由于无需PCR,不会产生由于PCR过程中碱基错配导致的系统误差。,疟原虫,均一覆盖,偏好覆盖,Sequence Bias Related Holes in 2nd Gen Data,PacBio 可以解决NGS哪些困扰?,Accuracy Increase With Sequencing Coverage,.,PacBio 可以解决NGS哪些困

    9、扰?,PacBio第三代测序技术原理,介孔分子筛,特制的DNA聚合酶,-反应速度快 在体外工作时3bp/s-准确率高,是PCR用聚合酶的1000倍-链置换特性(即可以循环进行复制反应)-每一个SMART cell中有15万个ZMW孔,PacBio第三代测序技术原理,介孔分子筛,特制的DNA聚合酶,-NGS将荧光标记在核酸骨架上,需要检测一个切除一个-BioPac将荧光标记在焦磷酸链上,随着DNA合成反应的进行,被随时释放,无需额外切割,PacBio第三代测序技术原理,将DNA聚合酶、待测序列和不同荧光标记的dNTP放入ZMW孔的底部,进行合成反应。,孔底垂直发射激光激光激发4种荧光标记的dNT

    10、P不会激发游离的dNTP,二代测序数据的基本处理,数据样式,质量值,比对的过程,原理和常用软件,Fastq格式,FASTQ是基于文本的,保存生物序列(通常是核酸序列)和其测序质量信息的标准格式。其序列以及质量信息都是使用一个ASCII字符标示,目前已经成为高通量测序结果的事实标准。,序列标识以及相关的描述信息,以开头;第二行是序列 第三行以+开头,后面是序列标示符、描述信息,或者什么也不加 第四行,是质量信息,和第二行的序列相对应,每一个碱基都有一个质量评分,根据评分体系的不同,每个字符的含义表示的数字也不相同。,Fastq格式,EAS139:136:FC706VJ:2:2104:15343:

    11、197393 1:Y:18:ATCACG,质量值,Phred quality scores Q are defined as a property which is logarithmically related to the base-calling error probabilities P.,FastA格式,文件后缀名:*.fasta*.fa,Fasta格式首先以大于号“”开头,接着是序列的标识符数据库中的序列标识符必须保证唯一,换行后是序列信息,序列中允许空格,换行,空行,直到下一个大于号,表示该序列的结束,Raw reads 过滤,Using a custom perl script

    12、,we filtered out the reads with more than 10%unidentified nucleotides or more than 65%bases with Q 7.,(Wang et al.2010),Q20与Q30表示质量值(Q)大于等于20或30的碱基所占百分比,We applied the rmdup command of SAMTOOLS to remove the PCR duplications generated in the process of sequencing.,重测序数据的基本处理比对,bwa mem-t 32 Btau_4.2.

    13、fa WYX02.filter.1.filter.fq.gz WYX02.filter.2.filter.fq.gz|perl 00.01.filter.duplicate.v2.pepiline.pl|samtools view-bS-o WYX02.filter.bam-1 WYX02.filter.bam.log1 2 WYX02.filter.bam.log2,High quality reads were aligned to the reference genome using BWA-MEM with default parameters.,(Qiu et al.2015),Wh

    14、ats Alignment,In bioinformatics,a sequence alignment is a way of arranging the sequences of DNA,RNA,or protein to identify regions of similarity that may be a consequence of functional,structural,or evolutionary relationships between the sequences.,(Mount DM.2004),The mechanism of Alignment,Smith-Wa

    15、terman算法,建立打分矩阵,递归确定得分规则,The mechanism of Alignment,动态规划确定得分最大路径(即最佳匹配模式),The mechanism of Alignment,全局比对是全部待研究的全部序列的全部符号参加比较,最后也是全部序列的全部符号进行排列与计分,比对的结果中各序列长度相同。,The mechanism of Alignment,局部比对是全部序列的全部符号参加比较,最后只将各序列中得分高的片断中的符号进行排列与计分,即只排列局部的序列片断。上述的例子中将序列,The mechanism of Alignment,Find the sequence

    16、d reads placement in reference genome,重测序数据的基本处理比对,bwa mem-t 32 Btau_4.2.fa WYX02.filter.1.filter.fq.gz WYX02.filter.2.filter.fq.gz|perl 00.01.filter.duplicate.v2.pepiline.pl|samtools view-bS-o WYX02.filter.bam-1 WYX02.filter.bam.log1 2 WYX02.filter.bam.log2,High quality reads were aligned to the re

    17、ference genome using BWA-MEM with default parameters.,(Qiu et al.2015),重测序数据的基本处理比对,samtools sort WYX02.filter.bam WYX02.filter.sort,Sequence Alignment/Map(SAM)format files were imported to SAMtools for sorting and merging.,(Qiu et al.2015;Wang et al.2010),samtools rmdup WYX02.filter.rehead.bam WYX0

    18、2.filter.dedup.bam,We applied the rmdup command of SAMTOOLS to remove the PCR duplications generated in the process of sequencing.,重测序数据的基本处理比对,java-Xmx30g-jar GenomeAnalysisTK.jar-nt 32-fix_misencoded_quality_scores-fixMisencodedQuals-R Btau_4.2.fa-T RealignerTargetCreator-o WYX02.filter.realn.inte

    19、rvals-I WYX02.filter.dedup.bam,(Qiu et al.2015;Wang et al.2010),The Genome Analysis Toolkit(GATK)was used to perform local realignment of reads to enhance the alignments in the vicinity of indel polymorphisms.,Depth&Coverage,Depth(coverage)in DNA sequencing refers to the number of times a nucleotide

    20、 is read during the sequencing process.Depth can be calculated from the length of the original genome(G),the number of reads(N),and the average read length(L)as,Depth=N L/G,“Using next-generation sequencing technology,we resequenced three wild and three domestic yak with a mean of fivefold(5)coverag

    21、e using our published domestic yak genome as a reference.”,(Meyerson,M2010;Wang et al.2010),Depth&Coverage,对长100bp的目标区域进行捕获测序:采用单端测序,每个read长5bp;总共得到了200个reads;把所有的reads比对到目标区域后,100bp的目标区域中有98bp的位置至少有1个read覆盖到,换言之,剩余的2bp没有1个read覆盖。,Depth=200 X5/100=10 fold,Coverage(Cover)=98/100 100%=98%,“After eliminating unknown bases in the yak genome,at least 95%of the genome was covered by reads from a single individual.”,(Zhao et al.2013;Wang et al.2010),


    注意事项

    本文(高通量测序技术PPT文档格式.pptx)为本站会员主动上传,冰点文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知冰点文库(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

    copyright@ 2008-2023 冰点文库 网站版权所有

    经营许可证编号:鄂ICP备19020893号-2


    收起
    展开