扫码填写或分享
0%
第十六单元
*
1
某超市研究销售纪录数据后发现,买啤酒的人很大概率也会购买尿布,这种属于数据挖掘的哪类问题?

*
2
当不知道数据所带标签时,可以使用哪种技术促使带同类标签的数据与带其他标签的数据相分离?

*
3
一所大学内的各年纪人数分别为:一年级200人,二年级160人,三年级130人,四年级110人。则年级属性的众数是:

*
4
以下关于spark streaming说法正确的是

*
5
以下哪些算法是分类算法:

*
6
人面哪个不是 RDD 的特点

*
7
以下哪些算法是基于规则的分类器:

*
8
spark默认的存储级别

*
9
下面哪个端口不是spark自带服务的端口

*
10
spark中资源管理的主节点

*
11
AdaBoost的损失函数采用了

*
12
构造决策树时,期望是

*
13
能够比较不同模型性能的方法是

*
14
CART建立决策树时,依据()来筛选节点

*
15
下面哪一种描述不是KNN算法的优点

*
16
用C4.5生成决策树,是根据()来进行节点的选择

*
17
可以对()进行特征值分解

*
18
下列算法无法实现特征选择的是

*
19
随机森林中每棵树的特征集

*
20
ID3算法创建决策树时,节点选择是根据

*
21
Spark Streaming结果也能保存在很多地方比如如下那些选项?

*
22
下列哪些数据特性都是对聚类分析具有很强影响的:

*
23
Spark Streaming支持的数据输入源包括如下那那些选项?

*
24
以下属于聚类算法的是:

*
25
下面属于数据集的一般特性的有:

*
26
下列哪种方法可以用来减小过拟合?

*
27
随机森林的缺点有

*
28
常用的非线性激活函数有:

*
29
下列方法中,可以用于特征降维的方法包括?(多选)

*
30
spark中的distinct算子是由以下哪两种算子实现的 分值5分

*
31
监督学习的标准方法是将一组示例数据的分成训练数据集和测试数据集。

*
32
在机器学习和统计应用中,降维是指在计算时减少随机变量数目的处理过程,并且可以分为特征选择和特征提取。

*
33
支持向量机是一种无监督学习算法。

*
34
Spark Streaming数据输入后可以用Spark的高度抽象原语如: map、reduce、join、window等进行运算

*
35
决策树方法通常用于关联规则挖掘。

*
36
SVD分解只能对方阵进行分解。

*
37
"监督式学习中存在过拟合,而对于非监督式学习来说,没有过拟合"。

*
38
logistic 曲线是一种常见的 S 型函数。

*
39
Discretized Stream是Spark Streaming的基础抽象,代表持续性的数据流和经过各种Spark原语操作后的结果数据流

*
40
梯度下降方法,只包含批量梯度下降和小批量梯度下降

答题卡
已答0未答40
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40