智慧树知到大数据工具应用章节测试答案

更新时间:2023-07-10 03:26:22 阅读: 评论:0

第一章
1、    2011 年麦肯锡研究院提出的大数据定义是:大数据是指其大小超出了常规数据库工具获取、 储存、管理和( )能力的数据集。
A计算
B: 访问
C: 应用
D: 分析
答案 : 分析
2、 用4V来概括大数据的特点的话,一般是指:    ValueVelocity Volume和()。
适的拼音
A:Variety
B:Vainly
C:Vagary
D:Valley
答案 : Variety
3、 大数据分析四个方面的工作主要是:数据分类、    ( )、关联规则挖掘和时间序列预测
A: 数据统计
B: 数据计算
C: 数据聚类
D: 数据清洗
答案 : 数据聚类
4、    新浪和京东联合推出的大数据商品推荐,是由京东盲目推送到当前浏览新浪网站的
用户的页 面上的。
A:
B:
答案 :
5、目前的大数据处理技术只能处理结构化数据。
A:
B:
答案 :
第二章
1、我们常用的微软 Office 套件中的 Access 数据库软件的数据库文件格式后缀名是( ) A:mdf
B:mdb
感恩的意义
C:dbf
D:xls
: mdb 答案
、大多数日志文件的后缀名是(。    ) 2
A:txt
B:csv
C:xml
D:log
: log 答案
weka3 溢价发行债券、本课程重点介绍的软件的专有文件格式是()
A:MongoDB
B:ARFF
C:value
D:key map
答案 : ARFF
4、数据清洗工作的目的主要是要解决数据的完整性、唯一性、合法性和(    )。
A: 专业性
B:排他性
C: 一致性
D: 共享性
答案 : 一致性
5、八爪鱼软件的 “自定义采集” 工作方式下, 需要在软件里输入一个 ( )来作为采集的目标。
A: 电话号码
B: 关键词
C: 网页地址
D: 用户名
答案 : 网页地址
6、八爪鱼软件的采集规则可以通过文件的形式来导入或者导出,这种文件的后缀名是(    )
A:otd
B:jpg
C:png
D:gif
答案 : otd
可以通过“数据有效性”按钮操作来规范数据输入的范围。    Excel 7
A:
B:
答案 :
8、    Excel 不能导入 txt csv 格式的文件。
A:
B:
答案 : 徒手深蹲
9、    八爪鱼软件只能对软件内建了“简易采集”规则的网站采集数据。
A:
B:
答案 :
10、    八爪鱼软件进行自定义采集时,需要了解对网页的页面结构。
A:
B:
答案 :
第三章
1、 使用DBSCAN算法对鸢尾花数据集(Iris.aff    )进行聚类,将 epsilon参数设置为 minPoints 参数设置为 5,忽略 class 属性,那么将形成( )个簇。
A: 1
B: 2
C: 3
D: 4
答案 : 3
ps批量处理图片
0.2
设置为 4
)是错
2、 使用EM算法对天气数据集( weather.numeric.arff    )进行聚类,将 numClusters 即簇数为 4,其他参数保持默认值,忽略 class 属性,从结果中可知,下列选项中, ( 误的。
A: 模型的最大似然估计值是 -7.18
B: 这组数据用算法迭代 15
C: 第四个簇的先验概率是 0.14
D: 第四个簇的实例数为 4
答案 : 第四个簇的实例数为 4
3、使用 SimpleKMeans 算法对天气数据集( weather.numeric.arff )进行聚类,保持默认参数,
3 个簇以及欧氏距离。 选择 play 属性为忽略属性, 从结果中可知, 下列选项中,( )是错误
A: 这组数据用算法迭代四次
B: 产生了三个中心点
C: 聚合为 3 个簇,分别有 734 个实例
D: 人类学概论平方和误差为 8.928
软水是什么水答案 : 这组数据用算法迭代四次
4、使用线性回归(LinearRegression    )分类器和用 M5P分类器对cpu.arff    分别进行分类,由其
输出的误差指标可知(
)。
A LinearRegression
的标准误差比 M5P的标准误差小
B LinearRegression
的平均绝对误差比 M5P的平均绝对误差小
C LinearRegression
的相对误差比M5P的相对误差小
D LinearRegression
的平均方根误差比 M5P的平均方根误差大
答案LinearRegression    的平均方根误差比    M5P的平均方根误差大
分类器构建方案,在结果中,到达    M5P属性后,使用 CACH数据文件中的cpu.arff 、删去5传的近义词.
LM2的实例数有(
)个。
A 165
B 21
C: 23
D: 30
答案 : 21 6、根据 J48 分类器训练 inal.arff 所生产的决策树,当 outlook=sunny temperature=cool humidity =high windy=TRUE 时,分类的结果是( )。
A: Yes
B: No
C: 没有结果
D: 无法分类
答案 : No
7、根据 J48 分类器训练 iris.arff 所生产的决策树,当 pallength=4.4 palwidth=3.0 petallength=1.3 petalwidth=0.2 时,分类的结果是( )。
A: Iris-tosa
B: Iris-versicolor
C: Iris-virginica
D: 无法分类
答案 : Iris-tosa
8、关于 Weka 离散化说明正确的是(    )
A: 离散化是将数值属性转换为字符串型属性
B: 有监督离散化有两种等宽和等频方法
C: 等宽离散化是使实例分布均匀的
D: 离散化包括无监督离散化和有监督离散化 答案 : 离散化包括无监督离散化和有监督离散化 9、以下( )不是 Weka 的数据类型。
A: numeric
B: nominal
C: string
D: decimal
答案 : decimal
10、关于 Weka的文件类型描述错误的是(    )。
A: Weka 可以打开文件格式有 .arff .csv .xlsx
B: Weka 处理的数据集类似于关系数据库横行实例,竖行属性
C: arff ASCII 文件,可以用 Word 等文本编辑器打开查看
D: @relation 定义数据集名称, @data 之后呈现实例,每一行就是一个实例 答案 : Weka 可以打开文件格式有 .arff .csv .xlsx

本文发布于:2023-07-10 03:26:22,感谢您对本站的认可!

本文链接:https://www.wtabcd.cn/fanwen/fan/89/1075215.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:数据   离散   属性   采集   软件   结果
相关文章
留言与评论(共有 0 条评论)
   
验证码:
推荐文章
排行榜
Copyright ©2019-2022 Comsenz Inc.Powered by © 专利检索| 网站地图