扫码填写或分享
0%
第十三单元
*
1
以下关于spark streaming说法正确的是

*
2
storm和 spark streaming 最大的区别 ( )

*
3
下面哪个不是 RDD 的特点

*
4
spark默认的存储级别

*
5
Spark是一种快速、通用、可扩展的( )分析引擎

*
6
下面哪个端口不是spark自带服务的端口

*
7
spark中的实时计算系统是哪个

*
8
spark 组件不包含哪个

*
9
spark以高效的方式处理( )数据集

*
10
spark中reduceByKey算子具有以下哪个特性

*
11
spark中资源管理的主节点

*
12
stage的task数量是由什么决定的

*
13
spark中的 flatmap算子的特性是以下哪个选项

*
14
spark中的map算子适合处理以下哪种类型的数据

*
15
spark中的maptoPair算子适合处理以下哪种类型的数据

*
16
DataFrame和RDD最大的区别是什么

*
17
RDD.reduceByKey()说法正确的是

*
18
RDD.takeOrdered()说法正确的是

*
19
spark是基于内存计算的框架,以下不属于spark组件的是

*
20
spark内部集成的资源调度框架是哪个

*
21
Spark Streaming支持的数据输入源包括如下那些选项?

*
22
Spark Streaming结果也能保存在很多地方比如如下那些选项?

*
23
partition的哪些属性是在spark进行数据切分的时候决定的

*
24
下列 spark 算子中可以将数据持久化到硬盘上的算子是哪些

*
25
spark中的distinct算子是由以下哪两种算子实现的

*
26
spark框架的 API 支持哪种语言进行开发

*
27
ETL指的是?

*
28
下列属于 Spark的优点是

*
29
以下属于spark rdd的方法的是

*
30
对于 spark 框架的说法正确的是

*
31
Spark Streaming类似于Apache Storm,用于流式数据的处理

*
32
Spark Streaming有高吞吐量和容错能力强等特点

*
33
Spark Streaming数据输入后可以用Spark的高度抽象原语如:map、reduce、join、window等进行运算

*
34
Discretized Stream是Spark Streaming的基础抽象,代表持续性的数据流和经过各种Spark原语操作后的结果数据流

*
35
spark架构本身就具有读取hdfs数据的方法

*
36
DStream是一系列连续的RDD来表示。每个RDD含有一段时间间隔内的数据

*
37
Storm架构是一个实时的流式计算框架

*
38
spark架构在运行过程中是通过driver完成资源申请

*
39
spark架构在整个计算过程中,其partition个数是不可变的

*
40
Spark架构提供了大量的库,其中包含SQL、DataFrames、MLlib、GraphX、Spark Streaming等架构

答题卡
已答0未答40
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40