spark测试题

更新时间:2023-06-04 22:43:18 阅读: 评论:0

spark测试题rip
爱伦坡黑猫1. 的四⼤组件下⾯哪个不是 ( )
A.Spark Streaming B Mlib  C Graphx D Spark R
2.下⾯哪个端⼝不是 spark ⾃带服务的端⼝ ( )
A.8080
B.4040
C.8090
D.18080
3.spark 1.4 版本的最⼤变化 ( )
A spark sql Relea 版本
B 引⼊ Spark R
learnenglish
C DataFrame D⽀持动态资源分配
knife的复数
4. Spark Job 默认的调度模式 ( )
A FIFO
B FAIR
C ⽆
D 运⾏时指定
5.哪个不是本地模式运⾏的个条件 ( )
A abled=true
B 显式指定本地运⾏
C finalStage ⽆⽗ Stage
D partition默认值
6.下⾯哪个不是 RDD 的特点 ( )
A. 可分区  B 可序列化  C 可修改  D 可持久化
7. 关于⼴播变量,下⾯哪个是错误的 ( )
A 任何函数调⽤
B 是只读的
C 存储在各个节点
D 存储在磁盘或 HDFS
8. 关于累加器,下⾯哪个是错误的 ( )
A ⽀持加法
B ⽀持数值类型
C 可并⾏
D 不⽀持⾃定义类型
9.Spark ⽀持的分布式部署⽅式中哪个是错误的 ( )
A standalone
B spark on mesos
C spark on YARN
D Spark on local
10.Stage 的 Task 的数量由什么决定 ( )
A Partition
B Job
C Stage
D TaskScheduler画材
11.下⾯哪个操作是窄依赖 ( )
A join
B filter
C group
D sort
12.下⾯哪个操作肯定是宽依赖 ( )
A map
B flatMap
触不到的恋人美国C reduceByKey
D sample
13.spark 的 master 和 worker 通过什么⽅式进⾏通信的? ( )
A http
B nio
hardC netty
D Akka
14 默认的存储级别 ( )
A MEMORY_ONLY
B MEMORY_ONLY_SER
C MEMORY_AND_DISK
D MEMORY_AND_DISK_SER
15 veryMode 不⽀持那种 ( )视野英语
A.ZooKeeper
B. FileSystem  D NONE D
16.下列哪个不是 RDD 的缓存⽅法 ( )
A persist()
B Cache()
C Memory()
17.Task 运⾏在下来哪⾥个选项中 Executor 上的⼯作单元 ( )
A Driver program B. spark master  C.worker node D Cluster manager
18. 的元数据存储在 derby 和 中有什么区别 ( )
A.没区别
B.多会话
C.⽀持⽹络环境D的区别
19.DataFrame 和 RDD 最⼤的区别 ( )
directlyA.科学统计⽀持
B.多了 schema
C.存储⽅式不⼀样驴羚
D.外部数据源⽀持
20.Master 的 ElectedLeader 事件后做了哪些操作 ( )
A. 通知 driver
B.通知 worker
C.注册 application
D.直接 ALIVE
答案:
DCBAD  CDDDA
BCDAD  CCBBD

本文发布于:2023-06-04 22:43:18,感谢您对本站的认可!

本文链接:https://www.wtabcd.cn/fanwen/fan/78/865171.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:默认   类型   操作   依赖   美国   版本
相关文章
留言与评论(共有 0 条评论)
   
验证码:
推荐文章
排行榜
Copyright ©2019-2022 Comsenz Inc.Powered by © 专利检索| 网站地图