扫码填写或分享
登录后保存考试记录
立即登录
0%
spark理论选择题
欢迎参加本次考试测评,准备好了吗?我们现在开始吧!
*
1
Spark是由哪个实验室最初开发的?
该题配额已满,无法继续作答,请联系发布者
A.
AMP实验室
B.
Hadoop实验室
C.
Flink实验室
D.
TensorFlow实验室
*
2
Spark加入Apache孵化器项目是哪一年?
该题配额已满,无法继续作答,请联系发布者
A.
2010
B.
2011
C.
2012
D.
2013
*
3
Spark的主要计算模式是什么?
该题配额已满,无法继续作答,请联系发布者
A.
仅批处理
B.
仅流处理
C.
MapReduce
D.
DAG执行引擎
*
4
Spark支持哪些编程语言?
该题配额已满,无法继续作答,请联系发布者
A.
Scala和Java
B.
Python和R
C.
Scala、Java、Python和R
D.
仅Scala
*
5
Spark生态系统中不包括以下哪个组件?
该题配额已满,无法继续作答,请联系发布者
A.
Spark Core
B.
Spark SQL
C.
Hadoop MapReduce
D.
GraphX
*
6
Spark相比于Hadoop MapReduce的主要优点不包括以下哪项?
该题配额已满,无法继续作答,请联系发布者
A.
更灵活的编程模型
B.
内存计算
C.
更高的延迟
D.
DAG任务调度执行机制
*
7
Spark的哪个特性使其能够高效处理迭代运算?
该题配额已满,无法继续作答,请联系发布者
A.
磁盘IO优化
B.
中间结果持久化到内存
C.
任务之间的衔接IO开销
D.
表达能力有限
*
8
Spark支持的部署方式不包括以下哪项?
该题配额已满,无法继续作答,请联系发布者
A.
Local
B.
Standalone
C.
Spark on Mesos
D.
Spark on Hadoop
*
9
RDD代表什么?
该题配额已满,无法继续作答,请联系发布者
A.
Resilient Distributed Data
B.
Resilient Distributed Dataset
C.
Resilient Distributed Database
D.
Resilient Distributed Driver
*
10
DAG在Spark中代表什么?
该题配额已满,无法继续作答,请联系发布者
A.
Directed Acyclic Graph
B.
Data Acquisition Graph
C.
Distributed Application Graph
D.
Dynamic Algorithm Graph
*
11
Executor在Spark中的作用是什么?
该题配额已满,无法继续作答,请联系发布者
A.
运行应用程序的驱动器
B.
运行作业任务的工作节点
C.
负责资源分配的资源管理器
D.
负责具体任务的执行进程
*
12
Spark中的动作操作和转换操作的区别是什么?
该题配额已满,无法继续作答,请联系发布者
A.
动作操作触发计算,转换操作不触发
B.
转换操作触发计算,动作操作不触发
C.
两者都会触发计算
D.
两者都不会触发计算
*
13
Spark的容错性主要依赖于什么?
该题配额已满,无法继续作答,请联系发布者
A.
数据复制
B.
日志记录
C.
血缘关系
D.
回滚系统
*
14
Spark中窄依赖和宽依赖的区别是什么?
该题配额已满,无法继续作答,请联系发布者
A.
是否包含Shuffle操作
B.
是否可以并行处理
C.
是否可以优化
D.
是否可以持久化
*
15
Spark阶段划分的依据是什么?
该题配额已满,无法继续作答,请联系发布者
A.
RDD的数量
B.
作业的复杂度
C.
RDD之间的依赖关系
D.
节点的数量
*
16
流水线优化在Spark中是如何实现的?
该题配额已满,无法继续作答,请联系发布者
A.
通过宽依赖
B.
通过窄依赖
C.
通过Shuffle操作
D.
通过任务的同步执行
*
17
Spark支持的资源类型有哪些?
该题配额已满,无法继续作答,请联系发布者
A.
仅HDFS
B.
HDFS、Cassandra、HBase、Hive
C.
仅HBase和Hive
D.
仅Cassandra和MongoDB
*
18
TensorFlowOnSpark是为了解决什么问题而设计的?
该题配额已满,无法继续作答,请联系发布者
A.
大数据存储
B.
大数据与人工智能的结合
C.
图形处理
D.
机器学习算法优化
*
19
Spark SQL是Spark生态系统中的哪个组件?
该题配额已满,无法继续作答,请联系发布者
A.
用于批处理
B.
用于交互式查询
C.
用于实时流式计算
D.
用于图计算
*
20
Spark的惰性机制是什么?
该题配额已满,无法继续作答,请联系发布者
A.
遇到转换操作就立即计算
B.
遇到行动操作才触发计算
C.
每次操作都重新计算
D.
避免计算重复的操作
*
21
RDD是Spark中的什么抽象概念?
该题配额已满,无法继续作答,请联系发布者
A.
一种数据存储格式
B.
一种分布式内存的抽象
C.
一种关系型数据库
D.
一种计算模型
*
22
RDD的主要特点之一是:
该题配额已满,无法继续作答,请联系发布者
A.
易于数据修改
B.
只读性
C.
依赖于单一数据源
D.
有限的转换操作
*
23
RDD的依赖关系中,不涉及Shuffle操作的依赖被称为什么?
该题配额已满,无法继续作答,请联系发布者
A.
宽依赖
B.
窄依赖
C.
依赖窄化
D.
依赖宽化
*
24
Spark中,一个作业可以被划分成多少个阶段?
该题配额已满,无法继续作答,请联系发布者
A.
一个阶段
B.
两个阶段
C.
多个阶段
D.
不能划分阶段
*
25
当RDD的分区之间存在窄依赖时,它们可以如何优化执行?
该题配额已满,无法继续作答,请联系发布者
A.
增加数据复制
B.
实现流水线优化
C.
强制执行Shuffle
D.
减少任务并行度
答题卡
已答0
未答25
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25