扫码填写或分享
0%
第十七单元.xlsx
*
1
PCA特征值分解要求矩阵是()

*
2
以下关于Pandas描述正确的是:

*
3
正则化除了可以简化模型,还能解决()

*
4
下列哪个是岭回归的正规方程解析公式

*
5
已知坐标轴中两点A(2,−2)B(−1,2),这两点的曼哈顿距离(L1距离)为:

*
6
关于特征x,y之间相关系数的描述正确的是

*
7
用CART算法进行分类时,选择最优特征的最优划分点的准则是:

*
8
哪个是有监督学习技术

*
9
在K-Means算法中,其中的K具体指的是什么()

*
10
以下哪些不能清洗脏数据?

*
11
关于kmeans具体的算法步骤组合正确的是: 1.随机选择K个中心点 2.把每个数据点分配到离它最近的中心点; 3.重新计算每类中的点到该类中心点距离的平均值; 4.分配每个数据到它最近的中心点; 5.重复步骤3和4,直到所有的观测值不再被分配或是达到最大的迭代次数。

*
12
关于K-均值(K-means)聚类算法中的“k"描述正确的是:

*
13
K-均值算法中初始的K个质心怎么选

*
14
在Pandas中,导出数据到CSV文件正确的是:

*
15
以下哪个算法对数据有降维的作用

*
16
以下不属于线性回归模型的是

*
17
以下哪个在PCA算法求解步骤中不会出现

*
18
以下哪个模型可以实现猫的分类

*
19
下列哪个算法需计算信息增益

*
20
L2正则化表示为

*
21
随机森林中的“随机性”主要体现在()

*
22
主成分分析以最少的信息丢失为前提,将众多的原有变量综合成较少几个综合指标,通常综合指标(主成分)有以下几个特点:

*
23
Adaboost中有两种权重,体现在()

*
24
下列哪些算法属于集成学习:

*
25
聚类(clustering),就是根据数据的“相 似性”将数据分为多类的过程。估算两个不同样本之间的相似性,通常使用的方法就是计算两个 样本之间的“距离”,最常用的就包含以下哪些“距离”:

*
26
K-means算法中判断每个点归属哪个质心的距离怎么算

*
27
关于sklearn.cluster.KMeans 参数介绍正确的是:

*
28
主成分分析以最少的信息丢失为前提,将众多的原有变量综合成较少几个综合指标,通常综合指标(主成分)有以下几个特点:

*
29
下列哪些数据特性都是对聚类分析具有很强影响的:

*
30
以下哪些不能用来降维

*
31
关于L1和L2说法正确的是:

*
32
决策树算法常用来做聚类。

*
33
C4.5与CART既可以用于分类,又可以用于回归。

*
34
逻辑回归可以用来做垃圾邮件分类。

*
35
随机森林在对决策树进行bagging的基础上,在决策树的训练过程中引入了随机属性选择。

*
36
聚类(Clustering)是一种无监督学习(unsupervised learning),简单地说就是把相似的对象归到同一簇中。

*
37
K-均值算法中的“K”与KNN算法中的“K"指的是同一种概念。

*
38
朴素贝叶斯的思想是这样的: 如果一个事物在一些属性条件发生的情况下,事物属于A的概率>属于B的概率,则判定事物属于A。

*
39
朴素贝叶斯分类算法中“朴素”的意思是条件概率独立性。

*
40
在机器学习和统计应用中,降维是指在计算时减少随机变量数目的处理过程,并且可以分为特征选择和特征提取。

答题卡
已答0未答40
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40