扫码填写或分享
0%
第十四单元
*
1
spark可以编写sql脚本的框架是()
该题配额已满,无法继续作答,请联系发布者
A.
spark core
B.
spark streaming
C.
mlbase
D.
spark sql
*
2
spark中的图计算框架是 ( ):
该题配额已满,无法继续作答,请联系发布者
A.
spark core
B.
spark streaming
C.
mlbase
D.
Grophx
*
3
spark架构中为什么会出现控制算子
该题配额已满,无法继续作答,请联系发布者
A.
spark备份的安全原因
B.
spark用户的要求
C.
兼容hive
D.
兼容hbase
*
4
spark内部集成的standalone功能为
该题配额已满,无法继续作答,请联系发布者
A.
任务调度框架
B.
任务模式
C.
资源调度框架
D.
任务整合
*
5
Sark DataSet操作函数的方法中,下面哪个是不正确的
该题配额已满,无法继续作答,请联系发布者
A.
sortBy对数据集排序
B.
select对数据集选择列
C.
orderBy对数据集排序
D.
randomSplit对数据集按比例分割
*
6
SparkSession在Spark中有什么用
该题配额已满,无法继续作答,请联系发布者
A.
可以做特征变换和机器学习模型的抽象
B.
统一封装了SparkConf、SparkContext、SQLContext,是Spark的唯一入口
C.
构建机器学习工作流的容器
D.
可以用来拟合和训练数据的机器学习算法的抽象
*
7
Spark环境需要修改的配置文件是
该题配额已满,无法继续作答,请联系发布者
A.
spark-env.sh
B.
hdfs-site.xml
C.
mapred-site.xml
D.
core-site.xml
*
8
Spark DataSet中对两个数据集进行操作的指令不包括
该题配额已满,无法继续作答,请联系发布者
A.
except
B.
union
C.
intersect
D.
distinct
*
9
以下关于driver的特性说法不正确的是
该题配额已满,无法继续作答,请联系发布者
A.
driver只有一个创建连接的功能
B.
driver可以分发task任务
C.
driver可以对task任务的执行情况进行检测
D.
driver可以回收task运行的结果
*
10
属于spark的进程的是
该题配额已满,无法继续作答,请联系发布者
A.
namenode
B.
datanode
C.
nodemanager
D.
worker
*
11
spark 中的资源调度,必须先和哪个节点进行交互
该题配额已满,无法继续作答,请联系发布者
A.
master
B.
worker
C.
app
D.
ts
*
12
rdd 是由一系列的什么组成的
该题配额已满,无法继续作答,请联系发布者
A.
job
B.
driver
C.
partition
D.
worker
*
13
TaskSet会将DAG调度器的运行结果传给哪个阶段
该题配额已满,无法继续作答,请联系发布者
A.
Worker
B.
Master
C.
DAG
D.
Task调度器
*
14
DataFrames可以采用那个方法去注册临时表?
该题配额已满,无法继续作答,请联系发布者
A.
registerTempTable
B.
registerTable
C.
createTempTable
D.
addTempTable
*
15
RDD之间宽窄依赖关系的主要依据哪个的对应关系来划分的
该题配额已满,无法继续作答,请联系发布者
A.
partition
B.
worker
C.
master
D.
数据
*
16
分发task任务是哪个节点的作用
该题配额已满,无法继续作答,请联系发布者
A.
master
B.
driver
C.
worker
D.
application
*
17
spark中有向无环图指的是哪个
该题配额已满,无法继续作答,请联系发布者
A.
Master
B.
Task
C.
Driver
D.
DAG
*
18
task运行在下面哪里个选项中Executor上的工作单元
该题配额已满,无法继续作答,请联系发布者
A.
driver
B.
master
C.
worker
D.
cluster
*
19
worker组件在spark 的任务调度中具有以下哪个作用
该题配额已满,无法继续作答,请联系发布者
A.
计算数据
B.
存储数据
C.
运送数据
D.
心跳检测
*
20
Spark SQL 是一个用来处理结构化数据的spark组件。它提供了一个叫做()的可编程抽象数据模型
该题配额已满,无法继续作答,请联系发布者
A.
DataFrames
B.
Table
C.
DataSet
D.
RDD
*
21
以下属于spark启动后进程的是
该题配额已满,无法继续作答,请联系发布者
A.
master
B.
worker
C.
application
D.
driver
*
22
driver的特性的说法,哪些是正确的
该题配额已满,无法继续作答,请联系发布者
A.
driver只有一个创建连接的功能
B.
driver可以分发task任务
C.
driver可以对task任务的执行情况进行检测
D.
driver可以回收task运行的结果
*
23
kettle执行日志类别有?
该题配额已满,无法继续作答,请联系发布者
A.
Nothing
B.
Error
C.
Basic
D.
Debug
*
24
以下属于 Spark框架内容的是
该题配额已满,无法继续作答,请联系发布者
A.
SparkSQL
B.
Streaming
C.
GraphX
D.
Mahout
*
25
DataFrame可以通过多种来源创建:
该题配额已满,无法继续作答,请联系发布者
A.
结构化数据文件
B.
hive的表
C.
外部数据库
D.
RDDs
*
26
DataFrame支持如下那种风格
该题配额已满,无法继续作答,请联系发布者
A.
sql风格
B.
DSL风格
C.
RDD风格
D.
mybatis风格
*
27
以下关于driver的说法错误的是
该题配额已满,无法继续作答,请联系发布者
A.
driver只有一个创建连接的功能
B.
driver不能分发task任务
C.
driver可以对task任务的执行情况进行检测
D.
driver可以回收task运行的结果
*
28
spark架构中哪些架构可以相互转化
该题配额已满,无法继续作答,请联系发布者
A.
spark core
B.
spark sql
C.
spark streaming
D.
spark R
*
29
spark词频统计的过程包括以下哪些步骤
该题配额已满,无法继续作答,请联系发布者
A.
flatMap(lambda line:line.split())
B.
map(lambda x:(x,1))
C.
reduceByKey(lambda x,y:x+y)
D.
collect()
*
30
Spark中数据集发展经历了哪三个过程
该题配额已满,无法继续作答,请联系发布者
A.
RDD弹性分布式数据集
B.
DataFrame列结构化的分布式数据集
C.
Dataset序列化的结构数据
D.
DataFrame弹性分布式数据集
*
31
DataFrames配合JDBC,它还可以读取外部关系型数据库系统
该题配额已满,无法继续作答,请联系发布者
A.
正确
B.
错误
*
32
RDD可以转化为DataFrames,而且DataFrames也能转化为RDD
该题配额已满,无法继续作答,请联系发布者
A.
正确
B.
错误
*
33
能够在sparkSql中写sql语句
该题配额已满,无法继续作答,请联系发布者
A.
正确
B.
错误
*
34
sparkSql不能够访问hive中的数据
该题配额已满,无法继续作答,请联系发布者
A.
正确
B.
错误
*
35
DataFrame也是一个分布式数据容器
该题配额已满,无法继续作答,请联系发布者
A.
正确
B.
错误
*
36
DataFrame也支持嵌套数据类型(struct、array和map)
该题配额已满,无法继续作答,请联系发布者
A.
正确
B.
错误
*
37
DataFrame支持2种风格的sql操作,一种为SQL风格语法宁外一种为DSL风格语法
该题配额已满,无法继续作答,请联系发布者
A.
正确
B.
错误
*
38
sparkSql可以访问hive数据,并将其结果取回作为RDD使用
该题配额已满,无法继续作答,请联系发布者
A.
正确
B.
错误
*
39
sparkSql不能够连接jdbc
该题配额已满,无法继续作答,请联系发布者
A.
正确
B.
错误
*
40
sparkSql仅仅支持查询原生的RDD,其他方式的查询都不支持
该题配额已满,无法继续作答,请联系发布者
A.
正确
B.
错误
答题卡
已答0
未答40
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40