CDA Level1模拟题Word文档下载推荐.docx
- 文档编号:820250
- 上传时间:2023-04-29
- 格式:DOCX
- 页数:14
- 大小:19.89KB
CDA Level1模拟题Word文档下载推荐.docx
《CDA Level1模拟题Word文档下载推荐.docx》由会员分享,可在线阅读,更多相关《CDA Level1模拟题Word文档下载推荐.docx(14页珍藏版)》请在冰点文库上搜索。
C.堆叠柱形图
D.分组柱形图
5.
横截面数据主要注意以下哪个数据问题(
.异方差
B.不独立
C.非正态分布
D.不随机
A.
6.
以下叙述正确的是(
.极差较少受异常值的影响
B.四分位差较少受异常值的影响
C.方差较少受异常值的影响
D.标准差较少受异常值的影响
B。
7.
某汽车品牌预测到未来不同型号汽车的利润率和销售量会发生变化,希望根据利润最大化得到最优产量,这属于哪类数据分析过程(
A.预测型建模
B.预报
C.优化
D.报警
C
8.为研究某种减肥茶减肥效果是否显著,可以采用(
)分析方法。
A、单样本t检验
B、两独立样本t检验
C、两配对样本t检验
D、方差分析
9.
中心极限定理的假设不包括(
A.样本相互独立
B.样本具有相同分布
C.样本足够大
D.样本服从正态分布
10.下列场合下,(
)适合用t检验统计量
A.样本为小样本,且总体方差已知
B.样本为大样本,且总体方差已知
C.样本为小样本,且总体方差未知
D.样本为大样本,且总体方差未知
11.
方差分析表表如下,值20应填在哪个位置上(
方差来源
离差平方和
自由度
均方差
F值
组间
14245.83
3
4748.61
2.16
组内
A
B
总和
23
12.
某信用卡公司为了分析客户教育程度对授信额度是否有显著性差异,已知教育程度分为5种,每个教育程度取30个客户,则因素的水平为(
5
B
6
C
30
D
150
13.给出下列结论:
(1)在回归分析中,可用指数系数R方的值判断模型的拟合效果,R方越大,模型的拟合效果越好;
(2)在回归分析中,可用残差平方和判断模型的拟合效果,残差平方和越大,模型的拟合效果越好;
(3)在回归分析中,可用相关系数r的值判断模型的拟合效果,r越小,模型的拟合效果越好;
(4)在回归分析中,可用残差图判断模型的拟合效果,残差点比较均匀地落在水平的带状区域中,说明这样的模型比较合适.带状区域的宽度越窄,说明模型的拟合精度越高.
以上结论中,正确的有(
)个.
A.1
B.2
C.3
D.4
14.
下列关系中,属于正相关关系的有(
A.合理限度内,施肥量和平均单位产量之间的关系
B.产品产量与单位产品成本之间的关系
C.商品的流通费用与销售利润之间的关系
D.流通费用率与商品销售量之间的关系
15.下列关于SQL的说法错误的是(
SQL
对大小写不敏感
SQL为非过程化编程语言
不同的数据库的SQL完全一致
D一种数据库查询和程序设计语言,用于存取数据以及查询、更新和管理关系数据库系统
16.
要查询book表中所有书名中以“中国”开头的书籍的价格,可用(
)语句。
(A)
SELECT
price
FROM
book
WHERE
book_name
=
‘中国*’
(B)
LIKE
(C)
‘中国%’
(D)
‘中国%’
17.
为名为“zhangsan”的用户分配对数据库“studb”的“stuinfo”表查询和插入数据权限的语句是(
)
A.grant
select,insert
on
studb.stuinfo
for‘zhangsan’@’localhost’
B.grant
to
‘zhangsan’@’localhost’
C.grant‘zhangsan’@’localhost’
for
D.grant
‘zhangsan’@’localhost’
18.
对于表TA(tel,net,…),其中tel为手机号,net为订购的上网流量套餐,如50M、100M等,若未订购则为空。
为了分析客户上网对客户总费用的影响情况,下列哪种对空值的处理方式最合理的?
(
将空缺观测全部删除
用所有客户上网套餐的中位数来替代
C用所有客户上网套餐的众数来替代
单独作为一类或者填充为0
19.
以下哪种方法不属于预测性(有监督学习)模型(
A.决策树
B.线性回归
C.关联分析
D.判别分析
20.
主成分分析计算分为根据相关系数和协方差矩阵两种方式,以下哪种情况适合用协方差矩阵计算(
A.全部变量的量纲相同
B.全部变量的方差相同
C.全部变量的值域相同
D.任何变量都可以
C.
21.
下面关于因子分析的说法正确的是(
因子分析就是主成分分析
因子之间互相关也可不相关
因子受量纲的影响
可以对因子进行旋转,使其意义更明显
22.
以下哪种聚类方法需要实现指定聚类个数(
A.层次聚类
B.K均值聚类
C.基于密度的聚类
D.基于网格的聚类
答案:
B.
23.对快速聚类说法错误的是(
占内存少、计算量小、处理速度快
可以样本聚类,也可以对变量聚类
适合大样本
D需要事先确定多少个类别
24.
关于逻辑斯回归分析(logistic
regrssion
modle)说法正确的是(
A:
逻辑斯回归的因变量为数值变量
B:
逻辑斯回归的因变量为定性变量
C:
逻辑斯回归的因变量只能有两种取值
D:
逻辑斯回归自变量只能是一个
25.
通过广告费分析销售收入,丙公司的销售经理根据36个月销售收入和广告费用的关系开发了简单线性回归模型。
该模型如下所示,且给模型的判定系数为0.90。
Y=20
00元+2.50
X
其中,Y代表销售收入,X代表广告费用。
如果丙公司某月的广告费用为2
00元,那么销售收入的估计值为(
A.2550元
B.
2500元
C.
2350元
D.
500元
26.
以下哪一种方法不能用来分析时间序列数据?
德尔菲法
移动平均法
最小二乘法
指数平滑法
27.
根据时间序列乘法模型的原理,为了测度季节变动,需要从时间序列中(
A.减去长期趋势和循环变动
B.减去长期趋势、循环变动和不规则变动
C.除去长期趋势和循环变动
D.除去长期趋势、循环变动和不规则变动
28.
关于数据挖掘的方法论CRISP-DM说法正确的是(
这是SPSS公司,Daimler
Chrysler提出的数据挖掘流程
主要分为六步,业务理解,数据理解,数据准备,模型搭建,模型评估与模型发布
该方法论已经成功的在SAS
EM中进行了实施
这六个过程有严格的前后顺序,一气呵成,分析过程中不能逆转或者跳转
29.
RFM方法中的F说明客户的(
A.兴趣度
B.粘性
C.当前价值
D.未来价值
A。
30.
某汽车品牌委托某公司及时收集客户在微博上关于该品牌汽车的负面留言,这属于哪类商业智能系统(
A.常规报表
B.即席查询
C.多维分析
D.预警
31.
某公司的总会计师决定用决策模型应对不确定性问题。
目前,丙公司有两种方案可供选择,与另一跨国公司联合投资或不联合投资。
总会计师提供了以下信息:
方案1:
联合投资的结果和概率:
成功概率为60%,投资成本为1
200万元,投资成功的现金流为2
000万元,投资不成功的现金流为200万元,其他成本为0元,至此时已发生的成本为1
20万元。
方案2:
不联合投资的结果和概率:
至此时已发生的成本为1
20万元,其他成本为500
000
元。
下列哪项分别正确地反映了联合投资与不联合投资的期望值?
A.800
000元和-1
700
000元
B.-700
000元和-500
800
D.-700
32.
某公司在进行市场调研,以决定是否推出一款新产品。
调研得出的结论是:
出现有利结果的概率为60%,出现不利结果的概率为40%。
如果结果有利,则产品成功的概率为70%;
如果结果不利,则产品失败的概率会达到75%。
如果产品成功,该公司预期年利润将达到5
000元;
如果产品失败,该公司每年将损失2
000元。
那么,这款新产品的年利润期望值为(
500
B.1
640
2
D.2
650
二、多选题
1.
以下哪个分布是右偏分布(
.均匀分布
B.卡方分布
C.F分布
D.对数正态分布
BCD
2.在假设检验中,当我们做出拒绝原假设而接受备择假设的结论时,表示(ACE)
有充足的理由否定原假设
原假设必定是错误的
C犯错误的概率不大于a
D犯错误的概率不大于b
E
在H。
成立的情况下发生了小概率事件
若检验统计量F
近似等于1,说明(
A.组间方差中不包含系统因素的影响
B.组内方差中不包含系统因素的影响
C.组间方差中包含系统因素的影响
D.方差分析中不应拒绝原假设
AD
以下哪些变量使用RFM方法构造出来的(
A.最近3期境外消费金额
B.最近6期网银消费交易笔数
C.信用额度
D.距最近一次逾期的月数
ABD
5.如下表student中,如何筛选type为包含数学或语文的记录?
ID
type
score
A01
数学
78
A02
语文
76
A03
英语
90
A04
68
A05
84
select
*
from
student
where
type=”数学”
and
type=”语文”
or
type
in
(”数学”
”语文”)
(”数学”、
BC
主成分分析计算分选择相关系数计算法时,确定主成分个数的大致原则包括(
A.特征根值大于1
B.特征根值大于0.8
C.累积特征根值加总占总特征根值的80%以上
D.累积特征根值加总占总特征根值的90%以上
AC
以下哪个聚类分析的方法是利用统计学定义的距离进行度量(
A.层次聚类法
B.快速聚类法
C.基于密度的聚类法
D.基于网格的聚类法
AB
8.
以下关于皮尔森相关分析叙述正确的是(
A.两变量独立,两者的皮尔森相关系数必然等于0
B.两变量皮尔森相关系数不等于0,两者必然不独立
C.皮尔森相关系数是否等于零,不能指明两变量是否独立
D.两变量不独立,两者的皮尔森相关系数必然不等于0
在客户关系管理中,客户的生命周期都包括那几个阶段(
A.潜在客户
B.响应客户
C.即得客户
D.流失客户
ABCD.
10.
天猫分析人员希望通过聚类方法定位代商家刷信用级别的违规者,以下那种操作不应该进行:
对变量进行标准化
对变量进行百分位秩或Turkey正态性转换
对变量进行因子分析或变量聚类
对变量进行分箱处理
BD
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- CDA Level1模拟题 Level1 模拟