扫码填写或分享
0%
第八单元
*
1
1.(离线计算)spark的核心框架是()

*
2
2.(离线计算)spark框架中,整合机器学习库,并对外提供接口的框架是()

*
3
3.(离线计算)spark是哪个大学研发出来的

*
4
4.(离线计算)spark于以下哪年年诞生于AMPLab

*
5
5(离线计算)Apache Spark是一种快速、通用、可扩展的()分析引擎

*
6
6(离线计算)spark为分布式数据集的处理提供了一个有效框架,并以高效的方式处理()数据集

*
7
7(离线计算)spark可以编写sql脚本的框架()

*
8
8(离线计算)rdd是spark中个哪个架构提出的概念

*
9
9(离线计算)spark中的rdd不存储数据,存储的是

*
10
10(离线计算)action算子在spark程序运行的过程中有什么作用

*
11
11(离线计算)spark中的rdd是一个什么()数据集

*
12
12(离线计算)spark架构中cache算子具有以下哪个特性

*
13
13(离线计算)Spark 框架中用于数据处理的核心模型

*
14
14(离线计算)Spark 通过什么创建调度节点和计算节点

*
15
15(离线计算)Spark 框架根据需求将计算逻辑根据分区划分成不同的()

*
16
16(离线计算)当RDD 的部分分区数据丢失时,它可以根据什么存储的信息来重新运算和恢复丢失的数据分区

*
17
17窄依赖表示每一个父(上游)RDD 的 Partition 最多被子(下游)RDD 的() Partition 使用

*
18
18(离线计算)初始化一个 SparkContext的作用

*
19
19(离线计算)一个Action 算子就会生成一个()

*
20
20(离线计算)什么是指我们在集群中寻找运行节点的过程,一个每个worker需要使用心跳机制向master汇报自己状态

*
21
21spark的运行模式有哪些?:

*
22
22(离线计算)spark支持以下哪种运行模式

*
23
23(离线计算)spark API支持哪种语言

*
24
24(离线计算)下面对于spark的特点描述正确的是以下哪几个选项

*
25
25(离线计算)Spark有如以下特性()

*
26
26(离线计算)Spark对比Hadoop来说有以下哪些优势?

*
27
27(离线计算)属于spark启动后进程的是以下哪几个选项

*
28
28(离线计算)spark中以下选项哪些特性是rdd的特性()

*
29
29(离线计算)RDD 任务切分中间分为

*
30
30(离线计算)累加器用来把()变量信息聚合到()

*
31
21(离线计算)Spark 是在 Scala 语言中实现的,它将 Scala 用作其应用程序框架

*
32
22(离线计算)hadoop和spark的都是并行计算,两者都是用mr模型来进行并行计算,hadoop的一个作业称为job,job里面分为map task和reduce task,每个task都是在自己的进程中运行的,当task结束时,进程也会结束

*
33
23(离线计算)Hadoop之父Doug Cutting曾曰Spark迟早会把mapreduce给取代,意味着hadoop已经走向没落,会被取代逐渐淘汰

*
34
(离线计算)Spark 是在 Scala 语言中实现的,它将 Scala 用作其应用程序框架

*
35
24(离线计算)调度节点将任务根据计算节点状态发送到对应的计算节点进行计算

*
36
25(离线计算)RDD 只支持粗粒度转换

*
37
26(离线计算)DAG 记录了RDD 的转换过程和任务的阶段

*
38
27(离线计算)一个 Stage 阶段中,最后一个RDD 的分区个数+1就是Task 的个数

*
39
28(离线计算)资源调度是指我们在集群中寻找运行节点的过程,一个每个worker需要使用心跳机制向master汇报自己状态

*
40
29(离线计算)spark中的application代表一个应用程序

答题卡
已答0未答40
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40