扫码填写或分享
0%
第七单元.xlsx
*
1
spark中cache算子和persist算子的关系

*
2
哪个不是大数据计算引擎?

*
3
spark中的图计算框架是 ( ):

*
4
高阶函数是指?

*
5
spark是哪个大学研发出来的

*
6
spark于以下哪年年诞生于AMPLab

*
7
Apache Spark是一种快速、通用、可扩展的()分析引擎

*
8
spark为分布式数据集的处理提供了一个有效框架,并以高效的方式处理()数据集

*
9
以下哪个不属于spark的生态圈

*
10
spark程序不能运行方式

*
11
Redis是一个()存储系统

*
12
spark中的rdd不存储数据,存储的是

*
13
action算子在spark程序运行的过程中有什么作用

*
14
下列选项中是spark安装包自带的测试案例的是

*
15
worker组件在spark的任务调度中具有以下哪个作用

*
16
spark中的rdd是一个()数据集

*
17
在scala中定义方法使用关键字

*
18
spark架构中cache算子具有以下哪个特性

*
19
不属于Scala7种数值类型的是

*
20
列表的常用操作有哪些

*
21
下面对于spark的特点描述正确的是

*
22
Spark有如下特性

*
23
Spark对比Hadoop来说有如下优势?

*
24
val content: String = "hello world" 描述正确的是?

*
25
对于数组以下描述正确的是?

*
26
spark中cache算子和persist算子的关系

*
27
spark中以下哪些特性是rdd的特性

*
28
spark架构中cache算子应具有以下哪些特性?

*
29
spark比mapreduce快的原因不仅仅是因为内存

*
30
spark中无法实时计算

*
31
flume主要作用是收集日志数据

*
32
Spark的运算是面向集合的,不适用于需要异步细粒度更新状态的应用

*
33
spark可以将数据分析过程的中间输出保存在内存中,从而不需要从外部持久化存储中反复读写数据

*
34
spark使用Scala语言开发,代码表现力强,封装了大量高级运算API,极大提高数据处理的开发效率

*
35
spark中的application代表一个应用程序

*
36
Spark框架和Kafka框架使用Scala语言编写

*
37
spark切分完的partition的个数必须与block一致

*
38
spark在基于客户端模式运行时,driver会在一台机器指定启动

答题卡
已答0未答38
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38