人工智能技术在分析化学中的应用.ppt
- 文档编号:9007891
- 上传时间:2023-05-16
- 格式:PPT
- 页数:89
- 大小:4.12MB
人工智能技术在分析化学中的应用.ppt
《人工智能技术在分析化学中的应用.ppt》由会员分享,可在线阅读,更多相关《人工智能技术在分析化学中的应用.ppt(89页珍藏版)》请在冰点文库上搜索。
1智能,智能是个体有目的的行为、合理的思维,以及有效地适应环境的综合能力。
通俗地讲,智能是个体认识客观事物、客观世界和运用知识解决问题的能力。
智能的分类,生物质能BIBiologicalIntelligence人工智能AIArtificialIntelligence计算智能CIComputationalIntelligenceNN-NeuralNetworks神经网络PR-PatternRecognition模式识别,生物智能,以脑为主体的神经系统,最基本单位是生物神经元。
人类个体的智能是一种综合性能力,1)感知与认识事物、客观世界与自我的能力;2)通过学习取得经验、积累知识的能力;3)理解知识、运用知识和运用经验分析问题和解决问题的能力;4)联想、推理、判断、决策的能力;5)运用语言进行抽象、概括的能力;6)发现、发明、创造、创新的能力;7)实时地、迅速地、合理地应付复杂环境的能力;8)预测、洞察事物发展变化的能力。
智能是相对的、发展的。
离开特定时间说智能是困难的、没有意义的。
人工智能,人工智能是相对人的自然智能而言,即用人工的方法和技术,研制智能机器或智能系统来模仿、延伸和扩展人的智能,实现智能行为和“机器思维”解决需要人类专家才能处理的问题。
人工智能是人工制品(artifact)中所涉及的智能行为。
其中,智能行为包括:
感知(perception)、推理(Reasoning)、学习(learning)、通信(communicating)和复杂环境下的动作行为(acting)。
人工智能目标,人工智能目标是实现智能行为和“机器思维”,解决需要人类专家才能处理的问题。
1、研究像人一样工作的机器,甚至比人做得更好2、能够理解机器、人或动物的智能行为,智能革命,智能革命是指人的自然智能通过人工智能的模仿和扩展,实现社会生产的自动化和智能化,促进知识密集型经济的发展。
2人工智能的研究方法,人工智能经过发展,形成了许多学派。
不同学派的研究方法、学术观点、研究重点有所不同。
这里主要介绍认知学派、逻辑学派、行为主义学派和连接主义学派。
2.1认知学派(以Simon,Minskey和Newell等为代表),基本思想从人的思维活动出发,利用计算机进行宏观功能模拟。
基于物理符号系统假设,将任何信息加工系统看成是一个具体的物理系统。
基本观点物理系统表现智能行为的充要条件是该系统是一个物理符号系统。
主要工作1)Newell的LogicTheorist,模拟人证明数学定理的思维过程2)GPS,模拟人的解题过程(拟定初步解题计划利用公理、定理和规则,按规则实施解题过程不断进行“目的手段“分析,修订解题计划。
3)物理符号系统假设。
符号是模式。
物理符号系统的基本任务和功能是辨认相同的符号和区别不同的符号。
2.2逻辑学派(以McCarthy和Nilsson等为代表),基本思想用逻辑来研究人工智能,用形式化的方法(统一的逻辑框架)描述客观世界。
基本观点1)智能机器必须有关于自身环境的知识2)通用智能机器要能陈述性地表达关于自身环境的大部分知识3)通用智能机器表示陈述性知识的语言至少要有一阶逻辑的能力,主要工作1)概念化知识表示2)模型论语义3)演绎推理4)非单调逻辑用于常识推理,2.3行为主义学派(以Brooks为代表),基本思想以复杂的现实世界为背景,让人工智能理论先经受解决实际问题的考验,并在这种考验中成长。
智能只是在与环境的交互作用中表现出来。
基本观点1)到现场去2)物理实现3)初级智能4)行为产生智能,主要工作1)无需知识表示的智能2)无需推理的智能3)机器虫,2.4连接主义学派,基本思想从脑的神经系统结构出发来研究脑的功能,研究大量简单的神经元的集团信息处理能力及其动态行为,模拟和实现人的认识过程中的感知觉过程、形象思维、分布式记忆和自学习自组织过程。
基本观点1)神经网络以分布式方式存储信息2)神经网络以并行方式处理信息3)神经网络具有自组织、自学习能力主要工作人工神经网络,BNN,BPR,BI,ANN,APR,AI,CNN,CPR,CI,知识获取难度及计算量,3知识的获取过程,知识系统,知识工程已成为人工智能应用最显著的特点。
知识系统主要研究内容:
1、专家系统知识库+推理机2、知识库系统将知识以一定的结构存入,进行知识管理,实现知识共享3、智能决策系统4、知识科学,人工智能,借助技术或理论手段,应用数学方法和数值逻辑。
使用计算机等工具,模拟、延伸或扩展人的智能。
专家系统是人工智能的一个重要分支在化学领域中主要应用于以下几个方面:
谱图解析和有机化合物结构的阐明分离科学-GC、HPLC、CE等方法分离条件的选择试验方案的最优控制工业生产流程控制分子模拟设计-计算机辅助辅助合成路线方案的选择,专家系统,是一个智能的计算机软件系统,该系统利用已知的知识进行演绎推理。
世界上第一个专家系统(DENDRAL)诞生于化学领域,应用MS、NMR解释有机化合物的结构。
知识库(事实、直接推断),推理机,解决模块,用户接口,计算智能,模糊系统理论人工神经网络进化计算(主要是遗传算法),人工神经网络ArtificialNeuralNetwork,生物神经元,裸露的轴突末梢与其它神经细胞或效应器细胞构成突触联系。
生物神经元网络感觉神经元(传入神经元),与感受器相连中间神经元运动神经元(传出神经元),与效应起相连,六个基本特征,1)神经元及其联接;2)神经元之间的联接强度决定信号传递的强弱;3)神经元之间的联接强度是可以随训练改变的;4)信号可以是起刺激作用的,也可以是起抑制作用的;5)一个神经元接受的信号的累积效果决定该神经元的状态;6)每个神经元可以有一个“阈值”。
人工神经网络(ArtificialNeuralNetworks,简记作ANN),,是对人类大脑系统的一阶特性的一种描述。
简单地讲,它是一个数学模型,可以用电子线路来实现,也可以用计算机程序来模拟,是人工智能研究的一种方法。
作为5种能力综合表现形式的3种能力,发现、发明、创造、创新的能力实时、迅速、合理地应付复杂环境的能力预测、洞察事物发展、变化的能力,人工神经网络的提出,Newell和Simon假说:
一个物理系统表现智能行为的充要条件是它有一个物理符号系统.概念:
物理符号系统需要有一组称为符号的实体组成,它们都是物理模型,可以在另一类称为符号结构的实体中作为成分出现,以构成更高级别的系统.,困难:
抽象舍弃一些特性,同时保留一些特性形式化处理用物理符号及相应规则表达物理系统的存在和运行。
局限:
对全局性判断、模糊信息处理、多粒度的视觉信息处理等是非常困难的。
物理符号系统和人工神经网络系统的差别,两种人工智能技术的比较,人工神经网络的特点,信息的分布表示运算的全局并行和局部操作处理的非线性,ANN学习(Learning)能力,人工神经网络可以根据所在的环境去改变它的行为自相联的网络异相联的网络:
它在接受样本集合A时,可以抽取集合A中输入数据与输出数据之间的映射关系。
“抽象”功能。
不同的人工神经网络模型,有不同的学习/训练算法,基本特征的自动提取,由于其运算的不精确性,表现成“去噪音、容残缺”的能力,利用这种不精确性,比较自然地实现模式的自动分类。
普化(Generalization)能力与抽象能力,信息的分布存放,信息的分布存提供容错功能由于信息被分布存放在几乎整个网络中,所以,当其中的某一个点或者某几个点被破坏时,信息仍然可以被存取。
系统在受到局部损伤时还可以正常工作。
并不是说可以任意地对完成学习的网络进行修改。
也正是由于信息的分布存放,对一类网来说,当它完成学习后,如果再让它学习新的东西,这时就会破坏原来已学会的东西。
适应性(Applicability)问题,擅长两个方面:
对大量的数据进行分类,并且只有较少的几种情况;必须学习一个复杂的非线性映射。
目前应用:
人们主要将其用于语音、视觉、知识处理、辅助决策等方面。
在数据压缩、模式匹配、系统建模、模糊控制、求组合优化问题的最佳解的近似解(不是最佳近似解)等方面也有较好的应用。
神经元是构成神经网络的最基本单元(构件)。
人工神经元模型应该具有生物神经元的六个基本特性。
人工神经元模拟生物神经元的一阶特性。
输入:
X=(x1,x2,xn)联接权:
W=(w1,w2,wn)T网络输入:
net=xiwi向量形式:
net=XW,激活函数(ActivationFunction),激活函数执行对该神经元所获得的网络输入的变换,也可以称为激励函数、活化函数:
o=f(net)1、线性函数(LinerFunction)f(net)=k*net+c,非线性斜面函数(RampFunction),ifnetf(net)=k*netif|net|0为一常数,被称为饱和值,为该神经元的最大输出。
2、非线性斜面函数(RampFunction),阈值函数(ThresholdFunction)阶跃函数,ifnetf(net)=-ifnet、均为非负实数,为阈值二值形式:
1ifnetf(net)=0ifnet双极形式:
1ifnetf(net)=-1ifnet,阈值函数(ThresholdFunction)阶跃函数,-,o,net,0,4、S形函数,压缩函数(SquashingFunction)和逻辑斯特函数(LogisticFunction)。
f(net)=a+b/(1+exp(-d*net)a,b,d为常数。
它的饱和值为a和a+b。
最简单形式为:
f(net)=1/(1+exp(-d*net)函数的饱和值为0和1。
S形函数有较好的增益控制,4、S形函数,人工神经元网络,T,每个神经元均为多输入单输出的信息处理单元输入分兴奋性和抑制型两种神经元有阈值特性,应用,构造了具有3层节点的人工神经网络模型,将太湖2001年512月全湖共26个采样点的实测值作为学习样本,一共有268=208组数据。
从这些数据中分别随机抽取1/4的数据各52组作为检验样本和测试样本,其余的104组(占50%)数据作为训练样本。
每个样本均含有12个输入因子,分别是风速、风向、水温、高锰酸钾指数、浊度、叶绿素、透明度、5。
以浮游植物作为输出因子。
用2002年8月的各点的浮游植物数据进行预测比较,,人工神经网络模型,前向网络(I/O映射)感知器、BP、RBF反馈网络(演化式好善性非线性动力系统)Hopfield网络、回归BP、Boltzman机等自组织网络自适应共振网络、自组织特征映射网络,多层前向BP网络的优点,网络实质上实现了一个从输入到输出的映射功能,而数学理论已证明它具有实现任何复杂非线性映射的功能。
这使得它特别适合于求解内部机制复杂的问题;网络能通过学习带正确答案的实例集自动提取“合理的”求解规则,即具有自学习能力;网络具有一定的推广、概括能力。
多层前向BP网络存在的问题,BP算法的学习速度很慢,其原因主要有:
a由于BP算法本质上为梯度下降法,而它所要优化的目标函数又非常复杂,因此,必然会出现“锯齿形现象”,这使得BP算法低效;b存在麻痹现象,由于优化的目标函数很复杂,它必然会在神经元输出接近0或1的情况下,出现一些平坦区,在这些区域内,权值误差改变很小,使训练过程几乎停顿;c为了使网络执行BP算法,不能用传统的一维搜索法求每次迭代的步长,而必须把步长的更新规则预先赋予网络,这种方法将引起算法低效。
网络训练失败的可能性较大,其原因有:
a从数学角度看,BP算法为一种局部搜索的优化方法,但它要解决的问题为求解复杂非线性函数的全局极值,因此,算法很有可能陷入局部极值,使训练失败;b网络的逼近、推广能力同学习样本的典型性密切相关,而从问题中选取典型样本实例组成训练集是一个很困难的问题。
难以解决应用问题的实例规模和网络规模间的矛盾。
这涉及到网络容量的可能性与可行性的关系问题,即学习复杂性问题;网络结构的选择尚无一种统一而完整的理论指导,一般只能由经验选定。
为此,有人称神经网络的结构选择为一种艺术。
而网络的结构直接影响网络的逼近能力及推广性质。
因此,应用中如何选择合适的网络结构是一个重要的问题;新加入的样本要影响已学习成功的网络,而且刻画每个输入样本的特征的数目也必须相同;网络的预测能力(也称泛化能力、推广能力)与训练能力(也称逼近能力、学习能力)的矛盾。
一般情况下,训练能力差时,预测能力也差,并且一定程度上,随训练能力地提高,预测能力也提高。
但这种趋势有一个极限,当达到此极限时,随训练能力的提高,预测能力反而下降,即出现所谓“过拟合”现象。
此时,网络学习了过多的样本细节,而不能反映样本内含的规律。
人工神经网络的学习方式,有导师无导师自监督,分析化学信息获取手段,在信息社会中,InterNet是一颗最耀眼的明星。
InterNet被称为万维网、国际互联网或因特网,是由美国ARPNet发展起来的,采用TCP/IP协议通讯,是世界上最大的开放性全球信息网络。
http:
/,1搜索引擎,搜索引擎网站的主要资源是它的索引数据库,而非它的网页信息,因此它的主要功能就像图书馆的目录卡片一样,是为人们搜索Internet网上信息并提供获得所需信息的途径。
搜索引擎的索引数据库,以万维网资源为主,有的还包括电子邮件地址、新闻论坛文章,FTP,gopher等网上资源。
随着网络技术的飞速发展,Internet数据信息库积累的数据和主题越越多。
怎样快速、高效、经济地查询某个主题的所有信息,就成了一个十分热门的课题。
化学化工宏站点,与搜索引擎一样,宏站点也可以起到查询信息的作用,对于特定学科或专题信息的查找,由于大都是一些著名大学的相关院系建立,主题明确,组织得当,可信度高,在一定的程度上,它优于一般的大型搜索引擎。
对于化学工作者来说,收集、知道一些与本专业有关的宏站点,是Internet上化学信息查询的一条捷径。
因为宏站点大都用主题分类,仅仅简单地用浏览的方法就可得到所需的信息。
每一个这样的宏站点都已链接到其它的化学宏站点上,所有的化学宏站点都极为相似,因此一旦找到一个这类优秀站点,就基本上没有必要再去找其它宏站点。
中国科学院化工冶金研究所李晓霞等建立的CHIN(ChemicalInformationNetwork),它是中国科学院化工冶金研究所与联合国教科文组织UNESCO的合作项目,是关于Internet重要化学信息资源的导航系统。
ChIN有选择地对Internet重要的化学信息资源进行链接和介绍,力求使其反映Internet化学信息资源的概貌和最新发展动态。
ChINWeb网页由重要化学信息资源链接组成的目录以及被链接资源的简介页组成。
http:
/,化学类有用的宏站点,l化学教学资源http:
/www.anachem.umu.se/eks/pointers.htm由瑞典乌墨纳大学KnutIrgum设计,这是一个非常好的宏站点,有课程、教学工具、软件、作者已加评注等。
2Internet化学http:
/acad.tnstate.edu/chemnet/chem.html由田纳西州立大学ThomasGardner设计,这也是个很好的宏站点。
对可下载的软件、网络论坛、讨论组群、E-mail列表等给出评注。
其它的大多数未给出评注。
3Martindales化学http:
/www-sci.lib.uci.edu/HSG/GradChemistry.html#CHEMICALSJimMartindale.,对教程、物质安全数据、杂志、物理常数有评注。
4科学和数学教育的Internet资源http:
/www.inform.umd.edu:
8080/UMS+State/UMD-ProjectsMCTP/Technology/MCTP_WWW_Bookmarks.Html由Maryland大学TomOHaver设计,该站点涵盖自然科学所有学科。
5SheffieldChemDex索引http:
/www.shef.ac.uk/chemistry/chemdex/由Sheffield大学MarkWinter设计,最著名的化学宏站点之一,也是一个商业性站点,附有评注。
6WWW可视化学图书馆http:
/www.chem.ucla.edu/chempointers.html由California大学的MaxKopelvich设计,很详细,有大学链接,非赢利链接,商业链接等。
虚拟图书馆,是对INTERNET上的信息资源进行较为系统的组织、分类,在此基础上构建的一种WWW服务站点,此类站点大多能提供某一学科领域的多种资源,使用WWW软件设计的这种图形、文本交互式的用户友好的信息查询界面,用户无须精通计算机和网络知识就能熟练地使用浏览器,利用鼠标点击感兴趣的站点,服务器就会自动与有关资料所在的网点进行连接,并调出有关资料(或查询果)。
化学虚拟图书馆主要站点,http:
/www.chem.rpi.edu/chemres.html(化学信息资源导航系统)该网站由美国印第安那大学GaryWeggins编制,是目前化学化工类信息资源中最为详细的一个网络导航指南,包括网络论坛、讨论组群、E-mail列表,评注出色http:
/www.chem.ucla.edu/chempointers.html(化学信息虚拟图书馆)该Web端提供了大量的信息链接,指向INTERNET上那些有关化学研究最重要的信息资源,很详细,有大学链接,非赢利链接,商业链接等。
8.2.2电子论坛,电子论坛(LISTSERVE)是INTERNET上极受欢迎的一种信息交流形式,除LISTSERVE外,我们还可见到它的其它名称,如邮件列表(Mailinglist)、讨论组(DiscussionGroup)或电子公告牌(Springboard)等等。
电子论坛因其通过电子邮件来收发信息,也就是说用户可使用任何一种电子邮件系统来阅读新闻和其它信息,使用起来十分方便。
虽然它在对信息的处理和控制上还有待进一步加强,但仍不失为目前最受化学工作者青睐的网络信息交流工具。
8.2.3主题指南,在WWW中,人们已经编制了各种各样的主题指南,它是一种可供检索和查询的等级式主题目录,以超文本链接的方式将不同学科、专业、行业和区域的信息按照分类或主题目录的方式组织起来。
这些主题目录一般在大类目下分成若干小类目,类目之间按照等级系统排列,然后将人工或巡视软件搜集或选择的网页主题连接起来,用户通过主题目录的指引,逐层浏览,直到找出有关的信息为止。
最有名的主题指南,l英国图书馆员协会主题目录(BUBL)http:
/www.bub1.bath.ac/uk/bubl/Tree.html它是由英国图书馆员编制的高质量的主题目录。
该目录以国际十进制分类法和英文字母顺序两种方式组织学术机构或与学术有关的出版物,对从事学术研究的人员有根高的参考价值。
2主题资源指南信息中心(TheClearinghouseforSubject-OrientedResourceGuides)http:
/www.lib.umich.edu/chhome.html这是由美国密西根大学开发的项目,该主题目录适合于查询商业和学术信息。
一些搜索引擎,如Yahoo、Infoseek,也是以主题指南为主体的查询系统。
按照主题指商进行查询的主要优点是它反映了人在选择和组织信息时的知识和智慧,收录的网页经过筛选和系统组织,质量较高,条理性比较强,检索结果接近用户的信息需求。
它的缺点是搜集信息的速度远远比不上网络资源的增长速度,所建立的数据库的规模都比较小,检索的文件数量有限。
8.2.4化学专利及文献,专利中蕴含大量的化学信息,而化学信息在很大程度上由专利组成。
如化学文摘中,16%以上都和专利相关。
每年在不同国家都有成百上千的各类新专利公布,而这些专利涉及范围广、内容包罗万象。
所谓专利就是国家授予发明人的一种特权,在实行专利制度的国家,凡是本国或外国的个人和企业有了创造发明,都可以根据专利法的规定,向本国或外国专利局提出申请,经审查合格,批准授予在一定年限内享有创造发明成果的权利,并在法律上受到保护。
这样一种受到法律保护的技术专有权利叫做专利。
目前,世界上约有150多个国家和地区实施专利制度,有将近100个国家公布专利申请说明书和正式批准的专利说明书。
每年公布约100多万件专利,其中很多都是同一项发明创造向不同国家重复申请的专利,因此实际发明数量约40万件。
专利文献是当今世界科学技术发展的一个重要标志,每一项新的发明创造或技术改进,通常都首先反映在专利文献上,由于每件专利都凝聚了专利发明者最具有创造性的成果,因此对于我们研究国外科技水平的发展趋势,制定科研计划、评价采用新的科技成就的经济利益等方面,都明显地反映出使用专利情报的重要性。
长期以来,世界各国企业之间剧烈竞争的一个显著特点是情报信息的竞争。
情报机构工作的一个重要方面就是研究专利文献。
一般分为三类:
发明专利、实用新型专利、外观设计专利(如中国专利)。
美国专利分类:
实用新型专利(包括了发明专利)、E为再颁专利,P为植物专利,T为防卫性公告,H为法定发明登记专利,AI为改进专利。
不同国家专利的类型代码及含义都存在着差别。
专利类型,美国专利数据库,美国专利数据库-全文检索,QPAT-US(1974-)http:
/Gazette)(1995-现在)http:
/www.uspto.gov/web/offices/com/sol/og/由美国专利和商标局提供,包括专利全文数据库和专利文摘数据库,收录了1976年1月1日至今的美国专利,数据库每周更新一次。
全文数据库提供图形。
OfficialGazette每周四出版,它公布的专利和注册了的商标者公布对手,搜索或浏览1964至今的专利。
提供者:
USPTO。
美国专利文献数据库http:
/patents.uspto.gov/免费数据库,可搜索在1976年至今公布的美国专利的扉页信息。
提供者:
USPTO。
美国专利数据库主页:
分授权专利数据库和申请专利数据库两部分:
授权专利数据库提供了1790年至今各种类型的美国专利,其中有1790年至今的图像说明书,1976年至今的全文文本说明书(附图像联接);申请专利数据库只提供了2001年起在授权前的专利出版物中收录的实用新型专利(美国的实用新型专利包含了发明专利)申请说明书的文本和图像。
Dialog联机检索系统http:
/,作为目前全球最大的联机信息服务商,Dialog也是广大科技人员所熟知的一类科技情报检索系统,近年来,国内大部分图书馆己通过Te1net方式与其相连。
因此在Internet上也可以通过网络浏览器进行信息检索。
其专利信息资源主要提供世界专利数据库索引(WorldPatentIndex):
提供全球大约70多个国家的英文专利摘要索引;提供美国注册版权索引(USCopyrights);提供在世界知识产权组织,美国、英国、法国、德国等国登记注册的商标档案(TrademarkScan)。
中国专利的检索途径,中国国家知识产权局数据库(提供全文信息)http:
/万方数字资源系统(提供文摘信息)清华同方公司提供的中国专利数据库(提供文摘信息),中国国家知识产权局数据库主页:
收录85年至今的中国专利说明书,主题或专业专利/技术转换数据库,化学文摘专利累积(1975-)http:
/casweb.cas.org/chempatplus/可免费搜索自1971年至今的美国专利文献全文(1993年开始带有完整的专利页面影象文件),以及来自CAS的可以JAVA方式旋转的3D化学结构。
包含有CAS登记号和CAS索引字段。
免费检索题目和文摘。
付4美元可获得专利全文。
知识表达数据系统http:
/www.KnowledgeEgrantwinners),CorpTech和Bioscan,合并者和获取方数据库,Derwent专利数据库,NASA技术简介,技术档案等。
可通过拨号及互联网访问数据库。
外国专利数据库网址,美国专利商标局网站专利数据库http
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 人工智能 技术 分析化学 中的 应用