欢迎来到冰点文库! | 帮助中心 分享价值,成长自我!
冰点文库
全部分类
  • 临时分类>
  • IT计算机>
  • 经管营销>
  • 医药卫生>
  • 自然科学>
  • 农林牧渔>
  • 人文社科>
  • 工程科技>
  • PPT模板>
  • 求职职场>
  • 解决方案>
  • 总结汇报>
  • ImageVerifierCode 换一换
    首页 冰点文库 > 资源分类 > DOCX文档下载
    分享到微信 分享到微博 分享到QQ空间

    基因家族分析套路docx.docx

    • 资源ID:16898174       资源大小:648.77KB        全文页数:9页
    • 资源格式: DOCX        下载积分:6金币
    快捷下载 游客一键下载
    账号登录下载
    微信登录下载
    三方登录下载: 微信开放平台登录 QQ登录
    二维码
    微信扫一扫登录
    下载资源需要6金币
    邮箱/手机:
    温馨提示:
    快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。
    如填写123,账号就是123,密码也是123。
    支付方式: 支付宝    微信支付   
    验证码:   换一换

    加入VIP,免费下载
     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    基因家族分析套路docx.docx

    1、基因家族分析套路docx基因家族分析套路(一)近年来,测序价格的下降,导致越来越多的基因组完成了测序,在数据库中形成了大量的可用资源。如何利用这些资源呢?今天小编带你认识一下不测序也能发文章的思路-全基因组基因家族成员鉴定与分析(现在这一领域可是很热奥);一、基本分析内容 数据库检索与成员鉴定 进化树构建 保守domain和motif分析. 基因结构分析. 转录组或荧光定量表达分析.二、数据库检索与成员鉴定1、数据库检索1)首先了解数据库用法,学会下载你要分析物种的基因组相关数据。一般也就是下面这些数据库了 Brachypodiumdb: Rice?Genome?Annotation?Proj

    2、ect?:.2)已鉴定的家族成员获取。? ? ?如何获得其他物种已发表某个基因家族的所有成员呢,最简单的就是下载该物种蛋白序列文件(可以从上述数据库中下载),然后按照文章中的ID,找到对应成员。对于没有全基因组鉴定的,可以下列数据库中找:?a.?NCBI:?nucleotide?and?protein?db.2、比对工具。一般使用blast和hmmer,具体使用命令如下: Local?BLASTformatdbi?db.fasp?F/T;blastallp?blastp(orelse)?i?known.fasd?db.fasm?8?b?2(or?else)?e?1e-5?o?alignresu

    3、lt.txt.-b:output?two?different?members?in?subject?sequences?(db). Hmmer?(hidden?Markov?Model)?search.?Thesame?as?PSI-BLAST?in?function.?It?has?a?higher?sensitivity,?but?the?speed?islower.Command:3、过滤。 Identity:?至少50%. Cover?region:?也要超过50%或者蛋白结构域的长度. EST?支持 ?Blast?and?Hmmer同时检测到4、通过上述操作获得某家族的所有成员基因家

    4、族分析套路(二)本次主要讲解在基因家族分析类文章中,进化部分分析的内容。主要是进化树的构建与分析。一、构建进化树的基本步骤、多序列比对.?Muscle?program.、算法选择。三种.?NJ,?ML?and?BI.、软件选二、具体步骤?2.1?多序列比对。一般采用muscle。因为?MUSCLE?is?one?of?the?best-performing?multiple?alignment?programs?according?to?published?benchmark?tests,?with?accuracy?and?speed?that?are?consistently?better

    5、?than?CLUSTALW.2.2?模型选择。对于用蛋白序列构建进化树的可以采用下面命令:?java?-Xmx250m?-classpath?path/ProtTest.jar?prottest.ProtTest?-i?alignmfile.phy.运行结果如下图?注意:1)“.Phy”?format.?Only?allow?ten?charaters.注意名字不能重复相同。2)AIC:?Akaike?Information?Criterion?framework.3)Gamma?distribution?parameter?(G):?gamma?shape.3)proportion?of?

    6、invariable?sites:?I.2.3 构建进化树2.3.1?意义:a聚类分析。如亚家族分类。像MAPKKK基因家族通过进化树可以清楚分为?MEKK,?Raf?and?ZIK三个亚家族.b亲缘关系鉴定。在进化树上位于同一支的往往暗示这亲缘关系很近c?基因家族复制分析。研究基因家族复制事件(duplication?events),两种复制事件类型常采用的标准:Tandem?duplication:?Identity?and?cover?region?more?than?70%?and?tightly?linked?(Holub,?2001).2.3.2?进化树。一般ML树比较准确,但应结

    7、合方法,如NJ树,相互验证。2.3.3?进化部分分析:KaKs计算a.?ParaAT:?ParaAT.pl-h?test.homologs?-n?test.cds?-a?test.pep?-p?proc?f?axt?k?-o?outputc.分歧时间计算:Divergenttime(T)?calculation.?T=Ks/2.?:?mean?5.1-7.110-9?.d. Ka/Ks意义:? Ka/Ks=1.中性进化。.? Ka/Ks?Ka/Ks1.正选择。Positively?selected?genes?and?produce?fitness?advantagemutations?to?

    8、evolve?new?functions.基因家族分析套路(三)本节主要讲基因结构分析套路1、Motif分析使用软件MEME,命令如下:?meme?sample.fa?-dna?revcomp?-nmotifs?10?-mod?zoops?-minw?6-maxw?50meme_htmlFormat.html2、基因结构分布图用法如下:结果展示3、基因结构常见统计信息:自己excel或写程序统计?a.?The?number?of?intron?andexon.?b.?The?splicing?intronpattern?inculding?0,1,2?phase.?c.?The?marked?

    9、region.?Forexample?kinase?domain.?d.?sequence?length.?e.?UTR.4、启动子分析。网站:主要做植物的:注意事项:a.?IE?brower.b.?Only?one?sequence?for?oncesearch?and?the?length?was?limited?in?1000?bp.c.?DNA?sequence?origin:?1000?or1500?bp?upstream?of?ATG?of?one?gene.分析结果:基因家族分析套路(四)一、转录组及芯片原始数据下载网站?1、?。用法见下图。GEO数据ID命名规则:GPL-GSE

    10、-GSM.GPL:?platformGSE:?multiple?series.GSM:?multiple?samples.GDS?GSE.?Thedifference?concentrated?on?the?data?labeled?GDS?can?be?analyzed?for?one?geneonline.?It?is?simple?and?easily.The?data?in?the?sameGPL?can?be?used?to?compare?inexperiment下面是在线分析转录组数据的用法:2、?该数据库下载数据用法如下:3、该数据库下载数据用法如下,注意用户名和密码!4、5、

    11、DRA?db()二、数据处理拿到原始数据,要进行处理,才能进行后续数据分析。1、芯片数据。原始数据格式“.cel”格式。以AffyMicroarray数据处理为例讲述主要的命令如下:?library(affy);?library(makecdfenv);?librarymydata?eset?write.exprs(eset,file=mydata.txt)design?colnames(design)?fit?contrast.matrix?fit2?fit2?topTable(fit2,?coef=1,adjust=fdr,?sort.by=B,?number=10)?#?Generate

    12、s?list?of?top?10?(number=10)differentially?expressed?genes?sorted?by?B-values?(sort.by=B)?for?firstcomparison?group.write.table(topTable(fit2,?coef=1,adjust=fdr,?sort.by=B,?number=500),file=limma_complete.xls,?row.names=F,?sep=t)?#?Exports?complete?limma?statistics?table?forfirst?comparison?group.re

    13、sults?-?decideTests(fit2,p.value=0.05);?vennDiagram(results)?2、转录组数据处理。原始数据格式为sra或fastq格式。Sra可以转换为fastq然后运用下面的命令进行处理。1)获得cleandata;?fastx_clipper?:clip?adapter.?fastq_quality_filter:?base?quality?control.?fastq_quality_trimmer:?trim?5?low?quality?bases.2)计算RPKM.?bowtie2-buildpath/db.seq?path/db?toph

    14、at?db?read.fastq?bam_filter?path/accepted_hits.bam?samtools?view?-h?-o?output-uniq.sam?output_uniq.bamexcel?for?calculation(low?frequencyreads?5?were?omitted?).3)差异表达的基因。?寻找存在差异表达的家族成员,推测其可能的功能。有下面两种分析策略,均可采用。a.倍数法。对于基因家族分析,可以采用倍数法,以2倍为标准,得到上调和小的基因b.CV值。计算某个成员在不同处理下的基因表达变化。CV?=SD/mean.Used?in?differenttissues?or?organs?anlysis.


    注意事项

    本文(基因家族分析套路docx.docx)为本站会员主动上传,冰点文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知冰点文库(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

    copyright@ 2008-2023 冰点文库 网站版权所有

    经营许可证编号:鄂ICP备19020893号-2


    收起
    展开