题库481-495
481方差分析的基本假设前提是ABC
A各处理条件下的样本均来自正态总体
B各处理条件下的样本相互独立
C各处理条件下样本的方差都相等
D各处理条件下样本均值相等方差可以不等
482若检验统计量下近似等于1则表示 。AD
A组间方差中不包含系统因素的影响
B组内方差中不包含系统因素的影响
C组间方差中包含系统因素的影响
D方差分析中不应拒绝原假设
483 决策树法分析问题的主要步骤为ABCD
A结构化问题
B设计可能结果发生的概率
C设计结果的得益
D分析问题
484下列哪些分类预测方法可适用有连续型变量的自变量?A D
A逻辑回归
B神经网络
CSVM算法
DC4.5算法
485以下有关直线回归方程的说法正确的是 。ABCD
A建立前提条件是 现象之间具有较密切的线性相关关系
B关键在于确定方程中的参数a和b
C表明两个相关变量间的数量变动关系
D可用来根据自变量值推算因变量值,并可进行回归预测
486聚类模型构建时,通常采用的相似性统计量计算方法为。BCD
A绝对距离
B欧式距离
C夹角余弦
D相关系数
487priori算法的计算复杂度受哪些因素影响?,ABCD
A支持度阀值
B项数维度)
C事务数
D事务平均宽度
488主成分分析中确定主成份个数是关键步骤,其大致原则包括AC
A特征根值大于1
B特征根值大于 0.8
C累计特征根植加总占总特征根值的80%以上
D累计特征根植加总占总特征根值的90%以上
489下列哪个场景可以使用决策树构建模型?AD
A预测申办信用卡的新客户是否将来会变成卡奴
B保险公司针对特定族群做人寿保险的推销
C找出购物篮里商品购买间的关联
D根据生活作息推断该病人得癌症的机率
490以下选项哪些对聚类分析影响很大?ACD
A聚类分析
B回归分析
C神经网络
D决策树算法
491 下列可以作为集群的管理工具。ACD
A Puppet
B Rsync + ssh + scp
C Pdsh
D Cloudera Manager
492给你几万条用户数据,每条用户数据的电话号码是其唯一的关键字段,请选择合适的数据结构,将这些用户数据加载到内存中管理起来。这个数据结构支持基于电话号码的快速查询,同时又支持新数据的快速插入(有新的用户不断注册进来):()BC
A链表
BHash表
CB+Tree
D队列
493对于Hadoop中client上传文件的描述正确的是BD
A数据经过NameNode传递给DataNode
B Client端将文件以Block为单位,管道方式依次传到DataNode
C Client只上传数据到一台DataNode,然后由NameNode负责Block复制工作
D 当某个DataNode失败,客户端会继续传给其它DataNode
494 lcloudera提供哪几种安装CDH的方法?ABCD
A Cloudera manager
B Tar bll
C Yum
D Rpm
495MapReduce与HBase的关系,哪些描述是正确的( ) 。BC
A两者不可或缺,MapReduce是HBase可以正常运行的保证
B两者不是强关联关系,没有MapReduce,HBase可以正常运行
CMapReduce可以直接访问HBase
D它们之间没有任何关系