首页 > 美文鉴赏

华为大数据HCIE-v2.0版本笔试题库

更新时间:2023-06-17 08:45:08 阅读：评论：0

华为大数据 HCIE-v2.0版本笔试题库

1.(判断)数据挖掘是通过对大量的数据进行分析，以发现和提取隐含在其中的具有价值的信息和知识的过程 [单选题] *

A.TRUE(正确答案)

B.FALSE

2.数据挖掘的开发工具除了Python以外，还包含以下哪些工具? *

A. Spark MLlib(正确答案)

B.MLS(机器学习服务)(正确答案)

C.IBM SPSS Modeler(正确答案)

D.Oracle Data Mining(正确答案)

3.以下哪些属于Python运算符? *

A.算数运算符(正确答案)

B.推理运算符

C.逻辑运算符(正确答案)狐狸毛领

好词好句简短D.比较运算符(正确答案)

4.(单选)假设A，B.C是三个矩阵，A是2X2，B是2X2阶，C是3x 2阶，以下哪一个矩阵的运算是有意义的? [单选题] *

男人为什么会硬A.A+B(正确答案)

B.AC

C.AB+AC

D.B+C

5.以下关于Python列表的描述正确的是? *花组词语

南京植物园

A.Python中的列表可以随时进行元素的添加和删除。(正确答案)

B.Python中的列表是可变的，定的元素可以是任何的数据类型。(正确答案)

C.Python中的列表由个括号包裹住元素，元素用逗号隔开。(正确答案)

D.Python中的列表企形式上类似于数组，是一个有序的序列。

6.(单选)以下哪个选项不是矩阵乘法对向量的变换? [单选题] *

A.投影

B.伸缩

C.曲线化(正确答案)

名列前茅

D.旋转

7.(单选)若随机变量X服从正态分布N(u,o^2)，则随机变量Y=aX+b服从以下哪个正态分布? [单选题] *

A.N(a^2 u+b,a^2 o^2)

焦虑烦燥怎么办

B.N(a u+b,a^2 o^2)(正确答案)

C.N(a u+b,a^2 o^2+b)

D.N(a u,a^2 o^2)

8.与面向过程相比，以下哪些是面向对象的特点? *

A.程序可拓展性没有明显的变化

B.提高代码复用性(正确答案)

C.增加了开发效率(正确答案)

D.使程序的编码更加灵活，提高了代码的可维护性(正确答案)

9.(单选)以下哪个措施属于反爬措施? [单选题] *

A.字体

B.滑块验证码

C.数据收费

D.以上全部正确(正确答案)

10.(判断)数据的ETL，其中E为Extract，T为Transform，L为Load。 [单选题] *

A.TRUE(正确答案)

B. FALSE

11.(单选)以下哪些选项不属于数值特征离散化的必要性? [单选题] *

A.数值高散化实际是一个数据简化机制，通过数值离散化过程，一个完整的数

据集变成一个个按照某种规则分类的子集，增强了模型的稳定性。

B.离散化数值在提高建模速度和提高模型精度上有显著作用。

C.离散化过程并没有带来信息丢失(正确答案)

D.离散化后的特征对异常数据有很强的鲁棒性，能减少噪音节点对数据的影响。

12.(判断)不要在整个数据集上做归一化处理，要区分训练集和测试集。 [单选题] *

A.TRUE

B.FALSE(正确答案)

13.数据挖掘中用于解决预测问题的模型主要包括哪几大类? *

A.分类(正确答案)

B.流行

C.回归(正确答案)

D.复变

14.(判断)可以利用Python 中的KNN 算法进行数据缺失值的处理。 [单选题] *

A.TRUE(正确答案)

B.FALSE

15.(单选)"点击率问题"是这样一个预测问题，99%的人不会点击，而1%的人会点击，所以这是一个非常不平衡的数据集。假设，现在我们已经建了一个模型来分类，而且有了99%的预测准确率，我们可以下的结论是? [单选题] *

A.模型预测准确率已经很高了，我们不需要做什么了。

B.模型预测准确率不高，我们需要做点什么改进模型。(正确答案)

C.无法下结论

D.以上都不对

16.机器学习中做特征选择时，以下哪种技术属于Filter(过滤法) [单选题] *

A.方差选择法

B.B.互信息法

C.C.卡方检验

D.相关系数法

E.以上全都正确(正确答案)

17.(单选)我们可以使用Python中scikit-learn库的( )函数，来对样本集进

feature_lection(特征选择)和dimensionality reduction(降维)? [单选题] *

A.sklearn. neighbors

B.sklearn. feature_lection(正确答案)

C.sklearn.linear model

D.sklearn. cluster

18.当数据预处理完成后，我们需要选择有意义的特征输入算法和模型进行训练。通常来说，可以从哪些方面考虑来如何进行特征选择? *如何建立网站

A.特征是否发散(正确答案)

B.特征与目标的相关性(正确答案)

C.特征的名称

D.以上全都正对

19.对于特征选择中的互信息法，以下理解正确的是? *

A.互信息法是从信息嫡的角度分析特征和输出值之间的关系评分.(正确答案)

B.在Python工具的sklearn模块中，可使用mutual_info_classif(分类)(正确答案)

和mutual_info_regression(回归)来计算各个输入行征和输出值之间的互信息。

C.互信息的结果对离散化的方式不敏感

D.互信息值越大，说明该特征和输出值之间的相关性越大，越需要保留。(正确答案)

20.(单选)以下关于Trapper(包装法)和FiLter(过滤法)的描述不正确的是? [单选题] *

A.Wrapper方法由于每次对子集的评价都要进行分类器的训练和测试，所以算法计算复杂度很高。

B.Trapper方法选出的特征通用性较强，当改变学习算法时，也不需要针对该学习算法重新进行特征选择。(正确答案)

C.相对于Filter(过滤法)，Wrapper方法找到的特征子集分类性能通常更

好。

D.对于大规模数据集来说，Wrapper算法的执行时间很长。

21.机器学习的分类主要有哪些? *

A.无监督学习(正确答案)

B.强化学习(正确答案)

本文发布于:2023-06-17 08:45:08，感谢您对本站的认可！

本文链接：https://www.wtabcd.cn/fanwen/fan/89/1042245.html

上一篇：字典学习（KSVD）详解

下一篇：VA_Trie_一种用于近似k近邻查询的高维索引结构

标签：答案特征数据模型

留言与评论（共有 0 条评论）