扫码填写或分享
0%
第十三单元
*
1
以下关于spark streaming说法正确的是
该题配额已满,无法继续作答,请联系发布者
A.
spark streaming分布式微批架构
B.
spark streaming实时存储架构
C.
spark streaming是普通存储架构
D.
spark streaming分布式实时计算架构
*
2
storm和 spark streaming 最大的区别 ( )
该题配额已满,无法继续作答,请联系发布者
A.
科学统计支持
B.
是否具有schema
C.
是否是真正的实时计算框架
D.
不同公司的产品
*
3
下面哪个不是 RDD 的特点
该题配额已满,无法继续作答,请联系发布者
A.
可分区
B.
可序列化
C.
可修改
D.
可持久化
*
4
spark默认的存储级别
该题配额已满,无法继续作答,请联系发布者
A.
MEMORY_ONLY
B.
MEMORY_ONLY_SER
C.
MEMORY_AND_DISK
D.
MEMORY_AND_DISK_SER
*
5
Spark是一种快速、通用、可扩展的( )分析引擎
该题配额已满,无法继续作答,请联系发布者
A.
大数据
B.
电商
C.
J2EE
D.
查询
*
6
下面哪个端口不是spark自带服务的端口
该题配额已满,无法继续作答,请联系发布者
A.
8080
B.
8090
C.
18080
D.
4040
*
7
spark中的实时计算系统是哪个
该题配额已满,无法继续作答,请联系发布者
A.
spark core
B.
spark streaming
C.
mlbase
D.
Grophx
*
8
spark 组件不包含哪个
该题配额已满,无法继续作答,请联系发布者
A.
spark core
B.
hdfs
C.
Graphx
D.
spark streaming
*
9
spark以高效的方式处理( )数据集
该题配额已满,无法继续作答,请联系发布者
A.
单机
B.
集中式
C.
分布式
D.
NOSQL
*
10
spark中reduceByKey算子具有以下哪个特性
该题配额已满,无法继续作答,请联系发布者
A.
延迟执行
B.
立即执行
C.
一致性
D.
冗余性
*
11
spark中资源管理的主节点
该题配额已满,无法继续作答,请联系发布者
A.
master
B.
worker
C.
application
D.
driver
*
12
stage的task数量是由什么决定的
该题配额已满,无法继续作答,请联系发布者
A.
partition
B.
job
C.
stage
D.
taskscheduler
*
13
spark中的 flatmap算子的特性是以下哪个选项
该题配额已满,无法继续作答,请联系发布者
A.
输入输出是一对一关系
B.
输入输出是一对多关系
C.
输入输出是多对多关系
D.
输入输出是多对一
*
14
spark中的map算子适合处理以下哪种类型的数据
该题配额已满,无法继续作答,请联系发布者
A.
简单类型的数据
B.
key,value格式的数据
C.
复合类型的数据
D.
NTFS类型的数据
*
15
spark中的maptoPair算子适合处理以下哪种类型的数据
该题配额已满,无法继续作答,请联系发布者
A.
简单类型的数据
B.
key,value格式的数据
C.
复合类型的数据
D.
NTFS类型的数据
*
16
DataFrame和RDD最大的区别是什么
该题配额已满,无法继续作答,请联系发布者
A.
科学统计支持
B.
多了schema
C.
存储方式不一样
D.
外部数据源支持
*
17
RDD.reduceByKey()说法正确的是
该题配额已满,无法继续作答,请联系发布者
A.
排序
B.
按key汇总
C.
分词
D.
打印前5行
*
18
RDD.takeOrdered()说法正确的是
该题配额已满,无法继续作答,请联系发布者
A.
降序排列
B.
顺序排列
C.
分组统计
D.
打印前5行
*
19
spark是基于内存计算的框架,以下不属于spark组件的是
该题配额已满,无法继续作答,请联系发布者
A.
SQL
B.
Streaming
C.
GraphX
D.
Mahout
*
20
spark内部集成的资源调度框架是哪个
该题配额已满,无法继续作答,请联系发布者
A.
driver
B.
standalone
C.
master
D.
yarn
*
21
Spark Streaming支持的数据输入源包括如下那些选项?
该题配额已满,无法继续作答,请联系发布者
A.
Kafka
B.
Flume
C.
Twitter
D.
ZeroMQ和简单的TCP套接字
*
22
Spark Streaming结果也能保存在很多地方比如如下那些选项?
该题配额已满,无法继续作答,请联系发布者
A.
HDFS
B.
数据库
C.
Dashboards
D.
zookeeper
*
23
partition的哪些属性是在spark进行数据切分的时候决定的
该题配额已满,无法继续作答,请联系发布者
A.
partition大小
B.
partition个数
C.
partiton的所有者
D.
parrtition的一切
*
24
下列 spark 算子中可以将数据持久化到硬盘上的算子是哪些
该题配额已满,无法继续作答,请联系发布者
A.
persist
B.
checkpoint
C.
cache
D.
map
*
25
spark中的distinct算子是由以下哪两种算子实现的
该题配额已满,无法继续作答,请联系发布者
A.
map算子
B.
groupbykey算子
C.
reducebykey算子
D.
orderby算子
*
26
spark框架的 API 支持哪种语言进行开发
该题配额已满,无法继续作答,请联系发布者
A.
java
B.
python
C.
scala
D.
go
*
27
ETL指的是?
该题配额已满,无法继续作答,请联系发布者
A.
抽取
B.
转换
C.
加载
D.
统计
*
28
下列属于 Spark的优点是
该题配额已满,无法继续作答,请联系发布者
A.
运算速度是Hadoop MapReduce的10到100倍
B.
容易使用,支持多种语言开发
C.
方便部署,可以连接各种数据源
D.
不可以进行机器学习
*
29
以下属于spark rdd的方法的是
该题配额已满,无法继续作答,请联系发布者
A.
first
B.
count
C.
collect
D.
head
*
30
对于 spark 框架的说法正确的是
该题配额已满,无法继续作答,请联系发布者
A.
运算速度是Hadoop MapReduce的10到100倍
B.
容易使用,支持多种语言开发
C.
方便部署,可以连接各种数据源
D.
不可以进行机器学习
*
31
Spark Streaming类似于Apache Storm,用于流式数据的处理
该题配额已满,无法继续作答,请联系发布者
A.
正确
B.
错误
*
32
Spark Streaming有高吞吐量和容错能力强等特点
该题配额已满,无法继续作答,请联系发布者
A.
正确
B.
错误
*
33
Spark Streaming数据输入后可以用Spark的高度抽象原语如:map、reduce、join、window等进行运算
该题配额已满,无法继续作答,请联系发布者
A.
正确
B.
错误
*
34
Discretized Stream是Spark Streaming的基础抽象,代表持续性的数据流和经过各种Spark原语操作后的结果数据流
该题配额已满,无法继续作答,请联系发布者
A.
正确
B.
错误
*
35
spark架构本身就具有读取hdfs数据的方法
该题配额已满,无法继续作答,请联系发布者
A.
正确
B.
错误
*
36
DStream是一系列连续的RDD来表示。每个RDD含有一段时间间隔内的数据
该题配额已满,无法继续作答,请联系发布者
A.
正确
B.
错误
*
37
Storm架构是一个实时的流式计算框架
该题配额已满,无法继续作答,请联系发布者
A.
正确
B.
错误
*
38
spark架构在运行过程中是通过driver完成资源申请
该题配额已满,无法继续作答,请联系发布者
A.
正确
B.
错误
*
39
spark架构在整个计算过程中,其partition个数是不可变的
该题配额已满,无法继续作答,请联系发布者
A.
正确
B.
错误
*
40
Spark架构提供了大量的库,其中包含SQL、DataFrames、MLlib、GraphX、Spark Streaming等架构
该题配额已满,无法继续作答,请联系发布者
A.
正确
B.
错误
答题卡
已答0
未答40
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40