扫码填写或分享
0%
考试测评标题
欢迎参加本次考试测评,准备好了吗?我们现在开始吧!
*
1
关于hive的外部表和内部表,说法中正确的是
该题配额已满,无法继续作答,请联系发布者
A.
内部表不能删除
B.
外部表不能删除
C.
删除外部表的时候hdfs上的数据不会丢失
D.
删除内部表的时候hdfs上的数据不会丢失
*
2
以下算子属于执行算子的是
该题配额已满,无法继续作答,请联系发布者
A.
map
B.
foreach
C.
flatmap
D.
join
*
3
rdd是由一系列的什么组成的
该题配额已满,无法继续作答,请联系发布者
A.
job
B.
driver
C.
partition
D.
worker
*
4
HDFS起源于下列哪一个()
该题配额已满,无法继续作答,请联系发布者
A.
FAT32
B.
EXT3
C.
NTFS
D.
GFS
*
5
rdd是spark中个哪个架构提出的概念
该题配额已满,无法继续作答,请联系发布者
A.
spark core
B.
spark streaming
C.
mlbase
D.
Grophx
*
6
Hive定义自定义函数类时,需要继承以下哪个类
该题配额已满,无法继续作答,请联系发布者
A.
FunctionRegistry
B.
driver
C.
MapReduce
D.
UDF
*
7
ZooKeeper用于创建顺序节点的命令是
该题配额已满,无法继续作答,请联系发布者
A.
create -e
B.
create
C.
create -s
D.
create -l
*
8
scala中所有类的父类是下列哪个选项
该题配额已满,无法继续作答,请联系发布者
A.
Any
B.
AnyInt
C.
AnyRef
D.
AnyVal
*
9
hive调用函数的时候,我们可以通过()来混合调用java函数和hive函数
该题配额已满,无法继续作答,请联系发布者
A.
java_method
B.
reflect
C.
java_call
D.
java
*
10
spark的源码是由哪几种语言编写完成的
该题配额已满,无法继续作答,请联系发布者
A.
java
B.
scala
C.
go
D.
r
*
11
Hadoop生态圈组件HDFS中NameNode进程的作用是什么?
该题配额已满,无法继续作答,请联系发布者
A.
存放数据块
B.
管理元数据
C.
维护目录树
D.
响应客户请求
*
12
(离线计算)RDD 任务切分中间分为
该题配额已满,无法继续作答,请联系发布者
A.
Application
B.
Task
C.
Stage
D.
Job
*
13
(离线计算)累加器用来把()变量信息聚合到()
该题配额已满,无法继续作答,请联系发布者
A.
全局
B.
Executor
C.
Task
D.
Driver
*
14
DataFrame可以在以下那些中使用DSL?
该题配额已满,无法继续作答,请联系发布者
A.
Java
B.
Scala
C.
R
D.
Python
*
15
RDD、DataFrame、DataSet的共性
该题配额已满,无法继续作答,请联系发布者
A.
三者都有惰性机制
B.
三者都支持 sparksql 操作
C.
三者有许多共同的函数
D.
三者都有 partition 的概念
*
16
大数据计算原则是
该题配额已满,无法继续作答,请联系发布者
A.
计算移动
B.
数据不移动
C.
数据移动
D.
计算不移动
*
17
redis集合操作包括哪些数据类型
该题配额已满,无法继续作答,请联系发布者
A.
SCARD
B.
SADD
C.
SMEMBERS
D.
SRANDMEMBER
*
18
kafka的设计目标有哪些
该题配额已满,无法继续作答,请联系发布者
A.
高吞吐率
B.
消息持久化
C.
完全分布式
D.
完美支持事务
*
19
以下有返回值的函数有哪些
该题配额已满,无法继续作答,请联系发布者
A.
map
B.
flatMap
C.
foreach
D.
filter
*
20
以下属于spark启动后进程的是
该题配额已满,无法继续作答,请联系发布者
A.
master
B.
worker
C.
application
D.
driver
*
21
spark中管理本机资源的节点是worker
该题配额已满,无法继续作答,请联系发布者
A.
正确
B.
错误
*
22
RDD可以转化为DataFrames,同理DataFrames也能转化为RDD
该题配额已满,无法继续作答,请联系发布者
A.
正确
B.
错误
*
23
DataFrame 不支持嵌套数据类型
该题配额已满,无法继续作答,请联系发布者
A.
正确
B.
错误
*
24
hive 是一个优秀的数据仓库,可以进行任意的增删改查
该题配额已满,无法继续作答,请联系发布者
A.
正确
B.
错误
*
25
spark比mapreduce快的原因不仅仅是因为内存
该题配额已满,无法继续作答,请联系发布者
A.
正确
B.
错误
*
26
37.在scala中for(i <- 0 until 10){println(i)}会输出11个数值
该题配额已满,无法继续作答,请联系发布者
A.
正确
B.
错误
*
27
spark本身没有读取hdfs数据的方法
该题配额已满,无法继续作答,请联系发布者
A.
正确
B.
错误
*
28
sparkSql不支持查询原生的RDD
该题配额已满,无法继续作答,请联系发布者
A.
正确
B.
错误
*
29
Redis中,可以通过FLUSHDB命令清空所有的数据库
该题配额已满,无法继续作答,请联系发布者
A.
正确
B.
错误
*
30
dataFrame和RDD类似,也是一个分布式数据容器
该题配额已满,无法继续作答,请联系发布者
A.
正确
B.
错误
*
31
(离线计算)Spark 是在 Scala 语言中实现的,它将 Scala 用作其应用程序框架
该题配额已满,无法继续作答,请联系发布者
A.
正确
B.
错误
答题卡
已答0
未答31
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31