扫码填写或分享
0%
第八单元
*
1
1.(离线计算)spark的核心框架是()
该题配额已满,无法继续作答,请联系发布者
A.
spark core
B.
spark streaming
C.
mlbase
D.
Grophx
*
2
2.(离线计算)spark框架中,整合机器学习库,并对外提供接口的框架是()
该题配额已满,无法继续作答,请联系发布者
A.
spark core
B.
spark streaming
C.
mlbase
D.
spark sql
*
3
3.(离线计算)spark是哪个大学研发出来的
该题配额已满,无法继续作答,请联系发布者
A.
阿里学院
B.
美国伯克利分校
C.
麻省理工大学
D.
复旦大学
*
4
4.(离线计算)spark于以下哪年年诞生于AMPLab
该题配额已满,无法继续作答,请联系发布者
A.
2009
B.
2010
C.
2018
D.
2012
*
5
5(离线计算)Apache Spark是一种快速、通用、可扩展的()分析引擎
该题配额已满,无法继续作答,请联系发布者
A.
大数据
B.
电商
C.
J2EE
D.
查询
*
6
6(离线计算)spark为分布式数据集的处理提供了一个有效框架,并以高效的方式处理()数据集
该题配额已满,无法继续作答,请联系发布者
A.
单机
B.
集中式
C.
分布式
D.
NOSQL
*
7
7(离线计算)spark可以编写sql脚本的框架()
该题配额已满,无法继续作答,请联系发布者
A.
spark core
B.
spark streaming
C.
mlbase
D.
spark sql
*
8
8(离线计算)rdd是spark中个哪个架构提出的概念
该题配额已满,无法继续作答,请联系发布者
A.
spark core
B.
spark streaming
C.
mlbase
D.
Grophx
*
9
9(离线计算)spark中的rdd不存储数据,存储的是
该题配额已满,无法继续作答,请联系发布者
A.
业务逻辑
B.
物理数据
C.
数据库数据
D.
物理逻辑
*
10
10(离线计算)action算子在spark程序运行的过程中有什么作用
该题配额已满,无法继续作答,请联系发布者
A.
懒执行
B.
立即执行
C.
一致性
D.
冗余性
*
11
11(离线计算)spark中的rdd是一个什么()数据集
该题配额已满,无法继续作答,请联系发布者
A.
弹性分布式
B.
弹性计算
C.
运送数据
D.
心跳
*
12
12(离线计算)spark架构中cache算子具有以下哪个特性
该题配额已满,无法继续作答,请联系发布者
A.
延迟执行
B.
立即执行
C.
等待执行
D.
陈列执行
*
13
13(离线计算)Spark 框架中用于数据处理的核心模型
该题配额已满,无法继续作答,请联系发布者
A.
DStreams
B.
RDD
C.
Frame
D.
SQL
*
14
14(离线计算)Spark 通过什么创建调度节点和计算节点
该题配额已满,无法继续作答,请联系发布者
A.
申请资源
B.
执行任务
C.
逻辑计算
D.
代码优化
*
15
15(离线计算)Spark 框架根据需求将计算逻辑根据分区划分成不同的()
该题配额已满,无法继续作答,请联系发布者
A.
节点
B.
资源请求
C.
任务
D.
RDD
*
16
16(离线计算)当RDD 的部分分区数据丢失时,它可以根据什么存储的信息来重新运算和恢复丢失的数据分区
该题配额已满,无法继续作答,请联系发布者
A.
Lineage
B.
RDD
C.
storm
D.
Frame
*
17
17窄依赖表示每一个父(上游)RDD 的 Partition 最多被子(下游)RDD 的() Partition 使用
该题配额已满,无法继续作答,请联系发布者
A.
一个
B.
两个
C.
多个
D.
0个
*
18
18(离线计算)初始化一个 SparkContext的作用
该题配额已满,无法继续作答,请联系发布者
A.
跳过加载外部设置
B.
连接主节点
C.
提高并发访问效率
D.
生成一个Application
*
19
19(离线计算)一个Action 算子就会生成一个()
该题配额已满,无法继续作答,请联系发布者
A.
RDD
B.
Job
C.
Frame
D.
Storm
*
20
20(离线计算)什么是指我们在集群中寻找运行节点的过程,一个每个worker需要使用心跳机制向master汇报自己状态
该题配额已满,无法继续作答,请联系发布者
A.
任务调度
B.
资源调度
C.
宽依赖
D.
窄依赖
*
21
21spark的运行模式有哪些?:
该题配额已满,无法继续作答,请联系发布者
A.
本地(local模式)
B.
stanalone模式
C.
yarn模式
D.
mesos模式
*
22
22(离线计算)spark支持以下哪种运行模式
该题配额已满,无法继续作答,请联系发布者
A.
基于standalone模式到的运行
B.
基于yarn的运行模式
C.
基于mesos模式的运行
D.
基于java的运行模式
*
23
23(离线计算)spark API支持哪种语言
该题配额已满,无法继续作答,请联系发布者
A.
java
B.
python
C.
scala
D.
go
*
24
24(离线计算)下面对于spark的特点描述正确的是以下哪几个选项
该题配额已满,无法继续作答,请联系发布者
A.
ache Spark是一种快速、通用、可扩展的大数据分析引擎
B.
spark为分布式数据集的处理提供了一个有效框架,并以高效的方式处理分布式数据集
C.
spark强调一站式解决方案,集批处理、实时流处理、交互式查询与图计算于一体,避免了多种运算场景下需要部署不同集群带来的资源浪费
D.
spark可以将数据分析过程的中间输出保存在内存中,从而不需要从外部持久化存储中反复读写数据,相较mapreduce能更好地适用于数据挖掘和机器学习等需要迭代运算的场景
*
25
25(离线计算)Spark有如以下特性()
该题配额已满,无法继续作答,请联系发布者
A.
良好的容错性:在分布式数据集计算时通过checkpoint来实现容错,当某个运算环节失败时,不需要从头开始重新计算
B.
开发便捷性:spark通过scala,java,python api及交互式shell提供丰富的使用方式
C.
不适合细粒度更新操作:Spark的运算是面向集合的,不适用于需要异步细粒度更新状态的应用,例如web服务的DAO层或web爬虫等
D.
以上答案都不符合其特性
*
26
26(离线计算)Spark对比Hadoop来说有以下哪些优势?
该题配额已满,无法继续作答,请联系发布者
A.
速度更快
B.
更适合迭代运算
C.
编程模型更加灵活,不局限于MAP与REDUCE操作
D.
中间结果可以存在内存,不需要磁盘的IO 读写
*
27
27(离线计算)属于spark启动后进程的是以下哪几个选项
该题配额已满,无法继续作答,请联系发布者
A.
master
B.
worker
C.
application
D.
driver
*
28
28(离线计算)spark中以下选项哪些特性是rdd的特性()
该题配额已满,无法继续作答,请联系发布者
A.
rdd是由一系列的partition组成的
B.
原子性
C.
算子作用在partition上
D.
每个rdd都会提供一批最优的计算位置
*
29
29(离线计算)RDD 任务切分中间分为
该题配额已满,无法继续作答,请联系发布者
A.
Application
B.
Task
C.
Stage
D.
Job
*
30
30(离线计算)累加器用来把()变量信息聚合到()
该题配额已满,无法继续作答,请联系发布者
A.
全局
B.
Executor
C.
Task
D.
Driver
*
31
21(离线计算)Spark 是在 Scala 语言中实现的,它将 Scala 用作其应用程序框架
该题配额已满,无法继续作答,请联系发布者
A.
正确
B.
错误
*
32
22(离线计算)hadoop和spark的都是并行计算,两者都是用mr模型来进行并行计算,hadoop的一个作业称为job,job里面分为map task和reduce task,每个task都是在自己的进程中运行的,当task结束时,进程也会结束
该题配额已满,无法继续作答,请联系发布者
A.
正确
B.
错误
*
33
23(离线计算)Hadoop之父Doug Cutting曾曰Spark迟早会把mapreduce给取代,意味着hadoop已经走向没落,会被取代逐渐淘汰
该题配额已满,无法继续作答,请联系发布者
A.
正确
B.
错误
*
34
(离线计算)Spark 是在 Scala 语言中实现的,它将 Scala 用作其应用程序框架
该题配额已满,无法继续作答,请联系发布者
A.
正确
B.
错误
*
35
24(离线计算)调度节点将任务根据计算节点状态发送到对应的计算节点进行计算
该题配额已满,无法继续作答,请联系发布者
A.
正确
B.
错误
*
36
25(离线计算)RDD 只支持粗粒度转换
该题配额已满,无法继续作答,请联系发布者
A.
正确
B.
错误
*
37
26(离线计算)DAG 记录了RDD 的转换过程和任务的阶段
该题配额已满,无法继续作答,请联系发布者
A.
正确
B.
错误
*
38
27(离线计算)一个 Stage 阶段中,最后一个RDD 的分区个数+1就是Task 的个数
该题配额已满,无法继续作答,请联系发布者
A.
正确
B.
错误
*
39
28(离线计算)资源调度是指我们在集群中寻找运行节点的过程,一个每个worker需要使用心跳机制向master汇报自己状态
该题配额已满,无法继续作答,请联系发布者
A.
正确
B.
错误
*
40
29(离线计算)spark中的application代表一个应用程序
该题配额已满,无法继续作答,请联系发布者
A.
正确
B.
错误
答题卡
已答0
未答40
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40