欢迎来到冰点文库! | 帮助中心 分享价值,成长自我!
冰点文库
全部分类
  • 临时分类>
  • IT计算机>
  • 经管营销>
  • 医药卫生>
  • 自然科学>
  • 农林牧渔>
  • 人文社科>
  • 工程科技>
  • PPT模板>
  • 求职职场>
  • 解决方案>
  • 总结汇报>
  • ImageVerifierCode 换一换
    首页 冰点文库 > 资源分类 > DOCX文档下载
    分享到微信 分享到微博 分享到QQ空间

    基于Android系统的手机语音识别软件开发Word格式文档下载.docx

    • 资源ID:6159713       资源大小:30.25KB        全文页数:21页
    • 资源格式: DOCX        下载积分:3金币
    快捷下载 游客一键下载
    账号登录下载
    微信登录下载
    三方登录下载: 微信开放平台登录 QQ登录
    二维码
    微信扫一扫登录
    下载资源需要3金币
    邮箱/手机:
    温馨提示:
    快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。
    如填写123,账号就是123,密码也是123。
    支付方式: 支付宝    微信支付   
    验证码:   换一换

    加入VIP,免费下载
     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    基于Android系统的手机语音识别软件开发Word格式文档下载.docx

    1、2.3 安卓平台介绍.52.4 安卓开发环境搭建.53 需求分析.93.1 系统开发目标.93.2 系统需求分析.93.2 可行性分析.114 软件设计与客户端功能实现.124.1 概要设计.124.2 包与类视图.124.3 语音合成功能实现.154.4 文件保存功能实现.164.5 文件上传功能实现.174.6 本章小结.195 服务器端功能实现.215.1 Tomcat服务器搭建215.2 服务器接收文件226 软件运行测试.246.1 软件测试目的.246.2 软件测试环境.246.3 功能测试.246.4 兼容性测试.257 总结与展望.267.1 毕业设计完成的任务.267.2 收

    2、获和总结.267.3 展望未来.26谢辞.27参考文献.271 绪论1.1 课题背景及相关概念随着现代科学的发展,移动互联网已迅速成为当今世界发展最快、规模最大的市场前景最好的行业。但由于现有的移动终端设备交互方式存在诸多局限性,譬如键盘太小,输入文字不便;以及无法处理特定场景下的交互,如驾车和步行等情形。所以人们在与机器的信息交流中,需要一种更加方便、自然的方式,而语言是人类最重要、最有效、最常用和最方便的通信方式。自从人类可以制造各种机器以来,人们就有一个理想,那就是让各种机器能“听懂”人类的语音并能按人的口头命令来行动,从而实现人机的语言交流。这就很容易让人们想到能否用人类的自然语言代替

    3、传统的人机交互方式(如键盘、鼠标等)。语音识别技术,也被称为自动语音识别(Automatic Speech Recognition 简称ASR),其目标是将人类的语音中的词汇内容转换为计算机可读的输入,例如按键、二进制编码或者字符序列,也就是让机器通过识别和理解把语音信号转变为相应的文本或命令的技术。自动语音识别技术所要解决的问题是让计算机能够“听懂”人类的语言,将语言中包含的文字信息“提取”出来。ASR技术的出现,使人类希望机器“听懂”人类的语言的理想得以实现。1.2 课题研究意义语音识别技术是一门交叉学科 ,语音识别正逐步成为信息技术中人机交互的关键技术,语音识别技术与语音合成技术的结合,

    4、开启了人机交互方式的新时代,它将彻底解放用户的双手与眼睛,使人们能够甩掉键盘,通过语音命令进行操作。语音技术的应用已经成为一个具有竞争性的新兴高技术产业。当今,语音识别产品在人机交互应用中占到越来越大的比例。可以预见,语音操作将会是未来很长一段时间内智能终端继键盘和触摸操作之后的必然发展趋势。1.3 研究现状语音识别的研究工作可以追溯到20世纪50年代AT&T贝尔实验室的Audry系统,它是一个可以识别十个英文数字的语音识别系统。1.3.1 国内研究现状2010年10月28日,“科大讯飞”语音云正式发布,全球首个同时提供语音合成、语音搜索、语音听写等智能语音交互能力的移动互联网智能交互平台“讯

    5、飞语音云”正式上线。所谓智能语音交互,通俗的说就是能让移动互联网的各种设备和服务像人一样“能听会说”:将人的语音转换成对应的文字,或者将文字转换成清晰流畅的语音朗读出来。同时发布的还有该平台的示范应用“讯飞语音输入法”体验版,智能手机安装后,可以用语音来进行QQ、短信、微博等内容的输入,使原来输入繁琐的短信书写和在线手机聊天等应用更加便捷有趣。1.3.2 国外研究现状语音技术是Google在Android1.6版本中加入的一项比较重要的新功能。世界上第一次把语音识别移植到嵌入式设备上的是飞利浦于1998年所推出的Genie 828c语言拨号的手机,但那时候的语音拨号还比较原始,只能辨认英文发音

    6、,而且成功率也很低。时至今日,语音识别技术在手机应用中已经有了重大的发展。继2009年年底正式发布了最先应用于诺基亚S60平台之上的中文语音搜索服务之后,Google官方又发布了一个为Android开发的语音控制应用“Voice Action”,这个语音控制系统支持用户通过语音指令发送电子邮件、短信、拨打电话和获取驾驶导航信息等。1.4 目前仍存在的问题21世纪作为“语音的世纪”除了蕴含无限的商机以外,也表明了它们存在发展的空间。概括地讲,有这样一些问题需要解决:(1)语音识别的方言和口音问题中文有八大方言区,现在很多语音识别系统,对标准普通话的识别性能很好,但是一旦有方言或者口音,性能就会马

    7、上下降。解决这个问题有着非常重要的意义,这将极大地拓展该技术的使用空间,因此必须解决好这个问题。(2)信道问题我们知道在无线互联应用中,涉及到的信道种类可能会很多,譬如固定电话、手机、IP、网络、车载系统等等,各种各样的信道都有不同的特性。语音识别、声纹识别和语音理解如何去适应不同信道的差异是一个不得不面对的问题。我们既需要解决多信道的问题,也要解决跨信道的问题。(3)背景噪音问题语音识别、声纹识别和语音理解等系统往往在有背景噪音时就不能正常工作了,这是由于背景噪音破坏了原始语音的频谱,或者说把原始语音部分或全部掩盖在噪音当中,因而无法准确地分离出来的缘故。解决好背景噪音的问题也是技术上面临的

    8、挑战之一。(4)自然语音理解领域我们必须有很好的理念和技术去解决口语语言现象,比如口语中的重复、改正、强调、倒叙、省略、拖音、韵律等等。1.5 论文结构安排论文共分六章,内容及章节安排如下:第一章,介绍语音识别软件开发的背景、研究意义、研究现状以及目前仍存在的问题。第二章,介绍Android平台的特征和系统架构,以及开发Android应用所需要的常用工具和开发环境的搭建。第三章,介绍软件的需求分析。第四章,介绍软件的具体功能的实现过程。第五章,介绍软件的测试过程。第六章,总结论文的收获。2 开发环境介绍2.1 Eclipse介绍Eclipse一个开放源代码的、基于Java的可扩展开发平台。就其

    9、本身而言,它只是一个框架和一组服务,用于通过插件组件构建开发环境。幸运的是,Eclipse附带了一个标准的插件集,包括Java开发工具(Java Development Kit,JDK)。Eclipse是一个市场占有率很高的Java IDE工具,专注于为高度集成的工具开发提供一个全功能的、具有商业品质的工业平台。主要由Eclipse项目、Eclipse工具项目和Eclipse技术项目三个项目组成,具体包括四个部分Eclipse Platform、JDT、CDT和PDE。JDT支持Java开发、CDT支持C开发、PDE用来支持插件开发,Eclipse Platform则是一个开放的可扩展IDE,

    10、提供了一个通用的开发平台。它提供建造块和构造并运行集成软件开发工具的基础。Eclipse Platform允许工具建造者独立开发与他人工具无缝集成的工具从而无须分辨一个工具功能在哪里结束,而另一个工具功能在哪里开始。Android推荐使用Eclipse来开发Android应用,并为它提供了专门的插件:Android Development Tools(ADT)。2.2 JDK开发环境介绍JDK(Java Development Kit)是Sun Microsystems针对Java开发人员发布的免费软件开发工具包(SDK,Software Development Kit)。自从Java推出以来

    11、,JDK已经成为使用最广泛的Java SDK。作为Java语言的SDK,普通用户并不需要安装JDK来运行Java程序,而只需要安装JRE(Java Runtime Environment)。而程序开发者必须安装JDK来编译、调试程序。JDK还包括了用于产品环境的各种类库,如基础类库rt.jar,以及给开发人员使用的补充库,如国际化与本地化的类库、IDL库等等。JDK是整个Java的核心,包括了Java运行环境、Java工具和Java基础类库。JDK是学好Java的第一步。最主流的JDK是Sun公司发布的JDK,除了Sun之外,还有很多公司和组织都开发了自己的JDK,例如IBM公司开发的JDK,

    12、BEA公司的Jrocket。其中专门运行在x86平台的Jrocket在服务端的运行效率也要比Sun JDK好很多。从Sun的JDK5.0开始,提供了泛型等非常实用的功能,其版本也不断更新,运行效率得到了非常大的提高。2.3 安卓平台介绍 Android是一种基于Linux的自由开放源代码的操作系统,主要使用于移动设备,如智能手机和平板电脑,由Google公司和开放手机联盟领导及开发。Android操作系统最初由Andy Rubin开发,主要支持手机。2005年8月由Google收购注资。2007年11月,Google与84家硬件制造商、软件开发商及电信运营商组建开放手机联盟共同研发改良Andr

    13、oid系统。随后Google以Apache开源许可证的授权方式,发布了Android的源代码。Android逐渐扩展到平板电脑及其他领域上,如电视、数码相机、游戏机等。Android的架构图如图2.1所示。Android的系统架构和其他操作系统一样,采用了分层的架构。从架构图看,Android分为四个层,从高层到低层分别是应用程序层、应用程序框架层、系统运行库层和Linux内核层。图2.1 Android系统架构图2.4 安卓开发环境搭建 2.4.1 Java环境搭建“我的电脑”,在弹出的窗口中选择属性,在左边高级系统设置中点击环境变量按钮,点击右下角的新建按钮,输入变量名:JAVA_HOME

    14、,变量值:(JDK安装目录),点击确定。以同样的方法新建变量名为:CLASSPATH,变量值为:.;%JAVA_HOME%lib;%JAVA_HOME%libdt.jar。(注意:变量值最前面的点号表示当前目录,不能省略)。如图2.2所示。图2.2 环境变量配置然后在系统变量中找到“path”,并点击编辑,在变量值的最后面追加“%JAVA_HOME%bin”,接着一直点击确定按钮,直到所有的窗口关闭。打开运行“窗口”,输入CMD命令,在提示符窗口中输入java version查看所安装JDK的版本,如图2.3。在提示符窗口中输入java,如果出现如图2.4界面则表示Java环境搭建成功。图2.

    15、3 JDK版本信息图2.4 环境搭建成功显示信息2.4.2 安装Eclipse开发工具 Eclipse的安装比较简单,直接登录Eclipse官网,下载Eclipse IDE for Java Developers。直接解压就可以了。2.4.3 下载安装SDK首先到SDK官方网站下载SDK包,然后解压。双击SDK Manager.exe,显示如图2.5,下载所需要的组件。图2.5 SDK下载组件界面2.4.4 安装ADT插件打开Eclipse,点击help?Install new Software进入后,点击add,命名及点击Archive你下载的ADT压缩包,点击OK,会解析出该插件的全部可用

    16、内容,全选(selcet all),点击下一步,安装时需要一定时间,在安装的过程中会出现一些提示,点击允许即可。安装完ADT插件后,点击window?preference,发现在左边的列表上多了一项Android,点击Android,并在右侧添加SDK目标位置,如图2.6。图2.6 添加Android SDK目录到这里,Android的开发环境就搭建完成了。然后创建一个安卓模拟器就可以做安卓开发了,如图2.7。图2.7 Android模拟器界面3 需求分析3.1 系统开发目标本课题中所要具体实现的是在Android移动平台及其各种定制手机中开发的一款通话间谍软件,它可以监听安装该软件的手机使用

    17、者的语音通话记录并将语音转换为文本保存在SD卡中,最终上传到服务器。3.2 系统需求分析3.2.1 系统模块分析本项目主要完成对Android手机用户的语音通话记录进行监听,从功能上分为三个部分,分别是语音模块、数据存储模块和服务器模块,每个模块又包含若干个子功能模块。项目功能模块结构如图3.1所示。图3.1 项目功能模块结构图 语音模块语音模块主要包括三个子模块:(1)访问通话记录。当用户使用手机进行通话时,软件将自动启动并访问用户的通话信息。(2)语音识别。将用户通话的信息进行识别并保存。(3)语音合成。将上一步识别的信息进行合成并转换成文本文件。 数据库模块(1)数据库读信息。读取语音模

    18、块中最终形成的文本内容。(2)数据库写信息。将读取的信息写到指定文件中并保存到手机的SD卡当中。(3)文件信息加密。对之前保存到SD卡当中的文件进行加密操作。(1)连接服务器。当用户处于网络连接状态下时,将软件和服务器端进行连接。(2)文件上传到服务器。服务器连接成功后,将文件上传到服务器。(3)文件信息解密。对上传的文件进行解密操作。3.2.2 系统调用API功能需求分析 根据对现在产品功能的分析,客户端系统调用API子系统的功能需要,如下表所示。表3.1 客户端系统调用API子系统功能需求功能需求功能描述获取通话记录应用程序需要获取用户者的通话记录,从而进行监听过程录音、采集语音数据要实现

    19、将用户的通话内容后台转换成文件,需要获取系统的录音权限访问手机SD卡应用程序得到用户的通话信息后,需要进一步将信息保存到手机内存当中,因此需要添加访问手机SD卡的权限数据的发送与接收由于软件需要将文件上传到服务器,所以需要连接到移动网络进行数据的发送与接收。发送数据方式为基于HTTP的POST请求方式。接收数据方式通过HttpServlet类来实现3.2.3 调用者功能需求 根据对现有产品功能的分析,客户端调用者子系统的功能需要,如下表3.2所示。表3.2 客户端调用者子系统功能需求开始语音识别用户点击语音识别的图标(实际软件使用时为手机的拨号或者接听电话按键),客户端并开始进行语音识别停止语

    20、音识别用户点击挂机键或者通话过程结束,软件并停止语音识别过程语音转换成文本语音识别过程结果后,软件并后台依次自动完成将语音转换成文本、文件保存、文件加密、文件上传操作文件保存文件加密文件上传3.3 可行性分析 该阶段通过对系统总目标的初步调研和分析,提出可行性方案并进行验证。在此,主要这从技术可行性、经济可行性和操作可行性三个方面进行分析。 经济可行性 本软件采用手机软件服务的形式呈现,既可直接安装到用户手机后台自动运行,也可以跟一些手机软件开发商合作绑定到软件上,从而实现软件的功能,因此市场开发空间较大,且软件开发成本低廉,从这个角度看,该软件可行。 技术可行性开发工具:Eclipse系统环

    21、境:Microsoft Windows XP或以上版本软件实现是依靠基于Android系统的开发技术,使用的是Java为主的开发语言进行开发,因此,该软件在技术上可行。 操作可行性软件采用Android四大组件中的Service进行设计。Service没有用户界面,可以一直在后台运行,并且随着手机开机而启动,从而实现后台监听。4 软件设计与客户端功能实现4.1 概要设计根据软件系统需求分析画出软件具体工作流程图,如图4.1所示。由于软件开发时设置为后台服务程序且随着手机开机自动启动,所以当手机开机后,服务即可后台运行。当用户进行通话时,软件服务并开始正式工作,首先将用户的语音通话内容进行识别,

    22、然后转化成文本并保存到手机内存当中,并通过文件加密模块对该文件进行加密操作。当用户手机连接到网络时,软件并可以自动上传到指定的服务器(本论文中使用的服务器为Tomcat搭建的服务器,搭建过程和具体实现代码详见第5章),最终在服务器端完成对文件的解密并接收,从而完成语音通话的监听。如果用户的手机并未连接到网络,由于本软件是以后台监听为宗旨,因此不能通过软件设计主动让用户手机连接到网络。只能等待用户自己连接到网络,才能进行下一步操作。图4.1 软件工作流程图4.2 包与类视图下图4.2为该项目应用程序客户端的工程文件组成示意图。所有的源文件都存入在一个名为CallMonitorClient的Android应用工程下,而服务器端则在一个名为CallMonitorServer的Android应用工程下。图4.1 CallMonitorClient工程文件结构其中,应用工程项目里的每一部分构成与作用如下: S Gen目录。该文件夹下面有一个R.java文件,R.java是在项目建立时由Eclipse自动来


    注意事项

    本文(基于Android系统的手机语音识别软件开发Word格式文档下载.docx)为本站会员主动上传,冰点文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知冰点文库(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

    copyright@ 2008-2023 冰点文库 网站版权所有

    经营许可证编号:鄂ICP备19020893号-2


    收起
    展开