扫码填写或分享
0%
第七单元
*
1
spark中cache算子和persist算子的关系
该题配额已满,无法继续作答,请联系发布者
A.
cache算子是persist算子的一个子集
B.
persist算子是cache算子的一个子集
C.
persist算子包含cache算子
D.
cache算子包含persist算子
*
2
哪个不是大数据计算引擎?
该题配额已满,无法继续作答,请联系发布者
A.
MapReduce
B.
Spark
C.
Flink
D.
MySQL
*
3
spark中的图计算框架是 ( ):
该题配额已满,无法继续作答,请联系发布者
A.
spark core
B.
spark streaming
C.
mlbase
D.
Grophx
*
4
高阶函数是指?
该题配额已满,无法继续作答,请联系发布者
A.
在程序中应该首先被定义的函数。
B.
将函数作为参数,并返回结果为函数的函数。
C.
函数参数为函数或返回结果为函数的函数。
D.
执行时间长的函数。
*
5
spark是哪个大学研发出来的
该题配额已满,无法继续作答,请联系发布者
A.
阿里学院
B.
美国伯克利分校
C.
麻省理工大学
D.
复旦大学
*
6
spark于以下哪年年诞生于AMPLab
该题配额已满,无法继续作答,请联系发布者
A.
2009
B.
2010
C.
2018
D.
2012
*
7
Apache Spark是一种快速、通用、可扩展的()分析引擎
该题配额已满,无法继续作答,请联系发布者
A.
大数据
B.
电商
C.
J2EE
D.
查询
*
8
spark为分布式数据集的处理提供了一个有效框架,并以高效的方式处理()数据集
该题配额已满,无法继续作答,请联系发布者
A.
单机
B.
集中式
C.
分布式
D.
NOSQL
*
9
以下哪个不属于spark的生态圈
该题配额已满,无法继续作答,请联系发布者
A.
sparksql
B.
spark Streaming
C.
MLIB
D.
HIVE
*
10
spark程序不能运行方式
该题配额已满,无法继续作答,请联系发布者
A.
local
B.
standalone
C.
yarn
D.
hdfs
*
11
Redis是一个()存储系统
该题配额已满,无法继续作答,请联系发布者
A.
spark core
B.
spark streaming
C.
mlbase
D.
Grophx
*
12
spark中的rdd不存储数据,存储的是
该题配额已满,无法继续作答,请联系发布者
A.
Key-value
B.
Master-slave
C.
Memcached
D.
Push/pop
*
13
action算子在spark程序运行的过程中有什么作用
该题配额已满,无法继续作答,请联系发布者
A.
懒执行
B.
立即执行
C.
一致性
D.
冗余性
*
14
下列选项中是spark安装包自带的测试案例的是
该题配额已满,无法继续作答,请联系发布者
A.
PI
B.
sa
C.
Sk
D.
Sw
*
15
worker组件在spark的任务调度中具有以下哪个作用
该题配额已满,无法继续作答,请联系发布者
A.
计算数据
B.
存储数据
C.
运送数据
D.
心跳检测
*
16
spark中的rdd是一个()数据集
该题配额已满,无法继续作答,请联系发布者
A.
弹性分布式
B.
弹性计算
C.
运送数据
D.
心跳
*
17
在scala中定义方法使用关键字
该题配额已满,无法继续作答,请联系发布者
A.
def
B.
main
C.
object
D.
class
*
18
spark架构中cache算子具有以下哪个特性
该题配额已满,无法继续作答,请联系发布者
A.
延迟执行
B.
立即执行
C.
等待执行
D.
陈列执行
*
19
不属于Scala7种数值类型的是
该题配额已满,无法继续作答,请联系发布者
A.
Char
B.
String
C.
Integer
D.
LongLong
*
20
列表的常用操作有哪些
该题配额已满,无法继续作答,请联系发布者
A.
交集(intersect)
B.
并集(union)
C.
获取列表的首个元素(take)和剩余部分(drop)
D.
拉链(zip)和拉开(unzip)
*
21
下面对于spark的特点描述正确的是
该题配额已满,无法继续作答,请联系发布者
A.
ache Spark是一种快速、通用、可扩展的大数据分析引擎
B.
spark为分布式数据集的处理提供了一个有效框架,并以高效的方式处理分布式数据集
C.
spark强调一站式解决方案,集批处理、实时流处理、交互式查询与图计算于一体,避免了多种运算场景下需要部署不同集群带来的资源浪费
D.
spark可以将数据分析过程的中间输出保存在内存中,从而不需要从外部持久化存储中反复读写数据,相较mapreduce能更好地适用于数据挖掘和机器学习等需要迭代运算的场景
*
22
Spark有如下特性
该题配额已满,无法继续作答,请联系发布者
A.
良好的容错性:在分布式数据集计算时通过checkpoint来实现容错,当某个运算环节失败时,不需要从头开始重新计算
B.
开发便捷性:spark通过scala,java,python api及交互式shell提供丰富的使用方式
C.
不适合细粒度更新操作:Spark的运算是面向集合的,不适用于需要异步细粒度更新状态的应用,例如web服务的DAO层或web爬虫等
D.
以上答案都不符合其特性
*
23
Spark对比Hadoop来说有如下优势?
该题配额已满,无法继续作答,请联系发布者
A.
速度更快
B.
更适合迭代运算
C.
编程模型更加灵活,不局限于MAP与REDUCE操作
D.
中间结果可以存在内存,不需要磁盘的IO 读写
*
24
val content: String = "hello world" 描述正确的是?
该题配额已满,无法继续作答,请联系发布者
A.
var val第一个是对scala中对变量的定义标志,其中var表示可变,val表示不可以变量
B.
content为变量的名字
C.
:String 表示是变量的类型,如果没有写,将来会自动推断
D.
"hello world"为变量的初始化
*
25
对于数组以下描述正确的是?
该题配额已满,无法继续作答,请联系发布者
A.
val arr = Array(4,3,5,1,2) val b = arr.sorted sorted将会把数组按升序进行重新排序
B.
val arr = Array(4,3,5,1,2) val b = arr.sorted sorted将会把数组按降序进行重新排序
C.
val arr = Array(4,3,5,1,2) val c = arr.sortWith(_>_) sortWith(_>_)表示降序排序
D.
val arr = Array(4,3,5,1,2) val c = arr.sortWith(_>_) sortWith(_<_)表示升序排序
*
26
spark中cache算子和persist算子的关系
该题配额已满,无法继续作答,请联系发布者
A.
cache算子是persist算子的一个子集
B.
persist算子是cache算子的一个子集
C.
persist算子包含cache算子
D.
cache算子包含persist算子
*
27
spark中以下哪些特性是rdd的特性
该题配额已满,无法继续作答,请联系发布者
A.
rdd是由一系列的partition组成的
B.
原子性
C.
算子作用在partition上
D.
每个rdd都会提供一批最优的计算位置
*
28
spark架构中cache算子应具有以下哪些特性?
该题配额已满,无法继续作答,请联系发布者
A.
延迟加载
B.
不能立即接action算子
C.
立即执行
D.
需要action算子触发
*
29
spark比mapreduce快的原因不仅仅是因为内存
该题配额已满,无法继续作答,请联系发布者
A.
正确
B.
错误
*
30
spark中无法实时计算
该题配额已满,无法继续作答,请联系发布者
A.
正确
B.
错误
*
31
flume主要作用是收集日志数据
该题配额已满,无法继续作答,请联系发布者
A.
正确
B.
错误
*
32
Spark的运算是面向集合的,不适用于需要异步细粒度更新状态的应用
该题配额已满,无法继续作答,请联系发布者
A.
正确
B.
错误
*
33
spark可以将数据分析过程的中间输出保存在内存中,从而不需要从外部持久化存储中反复读写数据
该题配额已满,无法继续作答,请联系发布者
A.
正确
B.
错误
*
34
spark使用Scala语言开发,代码表现力强,封装了大量高级运算API,极大提高数据处理的开发效率
该题配额已满,无法继续作答,请联系发布者
A.
正确
B.
错误
*
35
spark中的application代表一个应用程序
该题配额已满,无法继续作答,请联系发布者
A.
正确
B.
错误
*
36
Spark框架和Kafka框架使用Scala语言编写
该题配额已满,无法继续作答,请联系发布者
A.
正确
B.
错误
*
37
spark切分完的partition的个数必须与block一致
该题配额已满,无法继续作答,请联系发布者
A.
正确
B.
错误
*
38
spark在基于客户端模式运行时,driver会在一台机器指定启动
该题配额已满,无法继续作答,请联系发布者
A.
正确
B.
错误