1、20春学期数据科学导论在线作业4E3063E420春学期(1709、1803、1809、1903、1909、2003)数据科学导论在线作业实体识别的常见形式()A:同名异义B:异名同义C:单位不统一D:属性不同答案:D例如将工资收入属性值映射到-1,1或者0,1内属于数据变换中的()A:简单函数变换B:规范化C:属性构造D:连续属性离散化答案:B单层感知机模型属于()模型。A:二分类的线性分类模型B:二分类的非线性分类模型C:多分类的线性分类模型D:多分类的非线性分类模型答案:A通过变量标准化计算得到的回归方程称为()。A:标准化回归方程B:标准化偏回归方程C:标准化自回归方程D:标准化多回归
2、方程答案:A数据库中相关联的两张表都存储了用户的个人信息,但在用户的个人信息发生改变时只更新了一张表中的数据,这时两张表中就有了不一致的数据,这属于()A:异常值B:缺失值C:不一致的值D:重复值答案:C以下哪些不是缺失值的影响()A:数据建模将丢失大量有用信息B:数据建模的不确定性更加显著C:对整体总是不产生什么作用D:包含空值的数据可能会使建模过程陷入混乱,导致异常的输出答案:C层次聚类适合规模较()的数据集A:大B:中C:小D:所有答案:C以下哪个不是处理缺失值的方法()A:删除记录B:按照一定原则补充C:不处理D:随意填写答案:D聚类的最简单最基本方法是()。A:划分聚类B:层次聚类C:密度聚类D:距离聚类答案:A具有偏差和至少()个S型隐含层加上一个()输出层的网络能够逼近任何有理数。A:1,线性B:2,线性C:1,非线性D:2,非线性答案:A考虑下面的频繁3-项集的集合:1,2,3,1,2,4,1,2,5,1,3,4,1,3,5,2,3,4,2,3,5,3,4,5假定数据集中只有5个项,采用 合并策略,由候选产生过程得到4-项集不包含()A:1,2,3,4B:1,2,3,5C:1,2,4,5