19春学期(1709、1803、1809、1903)《大数据导论》在线作业 SAN是一种.docx
- 文档编号:796634
- 上传时间:2023-04-30
- 格式:DOCX
- 页数:11
- 大小:2.01MB
19春学期(1709、1803、1809、1903)《大数据导论》在线作业 SAN是一种.docx
《19春学期(1709、1803、1809、1903)《大数据导论》在线作业 SAN是一种.docx》由会员分享,可在线阅读,更多相关《19春学期(1709、1803、1809、1903)《大数据导论》在线作业 SAN是一种.docx(11页珍藏版)》请在冰点文库上搜索。
大数据导论
1单选题
1SAN是一种() B
A存储设备
B专为数据存储而设计构建的网络
C光纤交换机
DHBA
2
下列哪个R语言扩展包可以制作一系列的图像并将它们串联起来做成动画()
D
Aggplot2BnetworkCggmaps
Danimation
3数据产生方式变革中数据产生方式是主动的主要是来自哪个阶段( )。
B
A运营式系统阶段
B用户原创内容阶段
C感知式系统阶段
4基础设施即服务的英文简称是 AA IaaS
BPaaS
CSaaS
5以下不是数据仓库基本特征的是() B
A数据仓库是面向主题的
B数据仓库是面向事务的
C数据仓库的数据是相对稳定的
D数据仓库的数据是反映历史变化的
6数据仓库是随着时间变化的,下列不正确的是() C
A数据仓库随时间变化不断增加新内容
B捕捉到的新数据会覆盖原来的快照
C数据仓库随事件变化不断删去旧的数据内容
D
数据仓库中包含大量的综合数据,这些综合数据会随时间的变化不断进行重
新综合
7医疗健康数据的基本情况不包括以下哪项?
C
A诊疗数据
B个人健康管理数据
C公共安全数据
D健康档案数据
8下列不属于Google云计算平台技术架构的是() D
A并行数据处理MapReduce
B分布式锁Chubby
C结构化数据表BigTable
D弹性云计算EC2
9数据产生方式变革中数据产生方式是自动的主要是来自哪个阶段( )。
C
A运营式系统阶段
B用户原创内容阶段
C感知式系统阶段
10数据清洗的方法不包括 D
A缺失值处理
B噪声数据清除
C一致性检查
D重复数据记录处理
11()是MicrosoftOffice的核心组件 DA SQL
BWORD
CPPT
DEXCEL
12用于描述数据分散情况的是() B
A分布图
B箱式图
C饼图
D折线图
13哪个选项不属于大数据4V特点?
BA Volume
BValid
CVarietyD Value
14MapReduce中的Map和Reduce函数使用()进行输入输出 A
Akey/value对
B随机数值
C其他计算结果
15下面哪一项不是中国发展大数据产业的基础()。
D
A信息化积累了丰富的数据资源
B大数据技术创新取得明显突破
C大数据应用推动势头良好
D大数据产业支撑薄弱
2 多选题
1去除噪声使得数据光滑的技术主要有:
ABC
A分箱
B回归
C离群点分析
2基于大数据的临床决策支持系统的架构包括 ABD
A支撑层
B大数据分析层
C网络层
D应用层
3数据清洗(DataCleaning)的方法有() ABC
A填充空缺值
B清除数据中的噪声
C识别或删除离群点并解决不一致性
4KNIME(Konstanz Information
Miner)是一个对用户友好的、智能、开源的平台。
该平台包括了##、##、##
、##。
ABCD
A数据集成
B数据处理
C数据分析
D数据挖掘
5交通数据处理包括以下几个步骤() ABCD
A数据清洗
B数据映射
C数据组织
D数据聚类
6大数据存储的特点与挑战有() ABCD
A容量问题
B延迟问题
C安全问题
D成本问题
7传感器工作模式类别包括() ABC
A基于位置
B基于活动
C基于设备
8以下可以用于数据可视化的是()。
ABCDA R语言
BExcel
CRapidMinerD Weka
9数据分析的类型根据数据分析深度可以分为() ABC
A描述性分析
B预测性分析s
C规则性分析
10大数据在电信中的应用有 ABC
A基于用户、业务及流量分级的多维管控机制
B精准的客户分析及营销
C利用位置和轨迹信息服务社会
11百度大数据引擎主要包含三大组件() ABC
A开放云
B数据工厂
C百度大脑。
12常见的分类方法有 ABC
A决策树
B贝叶斯网络
C遗传算法
DFP算法
13可视化工具包括() ABCA Excel
BGoogleChart
CGephi
Dppt
14数据变换的常用方法有##,##,##,## ABCD
A中心化变换
B极差规格化变换
C标准化变换
D对数变换
15
借助于大数据提供的##和##,政府可为农业生产进行合理引导,依据需求进行
生产,避免产能过剩造成不必要的资源和社会财富浪费。
AB
A消费能力
B趋势报告
C购物结果
3 判断题
1
在现有大数据的存储中,结构化数据仅有20%,其余80%则在存在于物联网、电
子商务、社交网络等领域的半结构化数据和非结构化数据 A
A对
B错
2大数据的速度快体现在数据产生速度快和要求分析处理速度快 A
A对
B错
3
数据可根据产生主体的不同分为两类:
少量企业应用产生的数据和量个人用
户产生的数据 B
A对
B错
4 数据变换(Data
Transformation)就是把原始数据转化为适合于数据挖掘的数据形式 A
A对
B错
5
时空数据可视化与地理制图学相结合,重点对时间与空间维度,以及与之相关
的信息对象属性建立可视化表征,对与时间和空间密切相关的模式及规律进行展示 A
A对
B错
6
在集成期间,当一个数据库的属性与另一个数据库的属性匹配时,必须特别注
意数据的结构。
这旨在确保源系统中的函数依赖和参照约束与目标系统中的匹配。
A
A对
B错
7
基于大数据研究个体或群体行为,发现活动中蕴含的空间认知规律及空间行
为和交互模式,建立以人为本的地理信息服务,进而支持个体或群体时空行为决策。
A
A对
B错
8概念描述的主要方法是对目标数据进行概述性的总结,数据泛化 A
A对
B错
9
宁家骏委员指出,大数据要与“互联网+”医疗健康紧密结合起来,国家明确
支持“互联网+”医疗、“互联网+”健康。
A
A对
B错
10
通过大数据的分析将会更精确地预测未来的天气,帮助农民做好自然灾害的
预防工作,帮助政府实现农业的精细化管理和科学决策。
A
A对
B错
11通过增加CPU或模块来增加存储容量,这样可以不需要停机。
B
A对
B错
12
NoSQL是泛指非关系型、分布式和不提供ACID的数据库,它不是单纯地反对关
系型数据库,而是强调键值存储和文档数据库的优点。
A
A对
B错
13 《科学》(Science)杂志专刊——Dealing with
data,通过社会调查的方式,第一次综合分析了大数据对人们生活造成的影响
详细描述了人类面临的“数据困境”。
A
A对
B错
14
聚类分析是根据在数据中发现的描述对象及其关系的信息,将数据对象分组
。
组内相似度高,组间差异性大。
A
A对
B错
15
交通数据的来源包括车辆GPS数据,人类移动的GPS位置信息或者单位站点记
录,和监视设备的视频图像技术记录。
A
A对
B错
16数据获取方式分为主动式获取和被动式获取 A
A对
B错
17NAS是一种采用直接与网络介质相连的特殊设备实现数据存储的模式。
A
A对
B错
18美国《自然》(Nature)杂志专刊——The next
google,第一次正式提出“大数据”概念。
A
A对
B错
19分布式系统基础架构Hadoop的出现,为大数据带来了新的曙光; A
A对
B错
20
所有关系型数据中的数据全部为结构化数据。
半结构化数据就是介于完全结
构化数据和完全无结构化的数据之间的数据。
A
A对
B错
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 大数据导论 19春学期1709、1803、1809、1903大数据导论在线作业 SAN是一种 19 学期 1709 1803 1809 1903 数据 导论 在线 作业 SAN 一种