扫码填写或分享
0%
第十七单元.xlsx
*
1
PCA特征值分解要求矩阵是()
该题配额已满,无法继续作答,请联系发布者
A.
方阵型矩阵
B.
适用m*n阶矩阵(m不等于n)
C.
适用任意类型矩阵
D.
以上都不对
*
2
以下关于Pandas描述正确的是:
该题配额已满,无法继续作答,请联系发布者
A.
Pandas只能处理特定类型的数据
B.
Pandas是基于NumPy的一种工具
C.
Pandas主要包含两种种数据结构:Series(一维)和 DataFrame(二维)
D.
Pandas不能处理浮点及非浮点数据类型的缺失值(NaN)
*
3
正则化除了可以简化模型,还能解决()
该题配额已满,无法继续作答,请联系发布者
A.
防止欠拟合
B.
导致过拟合
C.
防止过拟合
D.
导致欠拟合
*
4
下列哪个是岭回归的正规方程解析公式
该题配额已满,无法继续作答,请联系发布者
A.
(XTX+λI)-1XTy
B.
(XTX+λI)
C.
(XTX)-1XTy
D.
(XTX)-1XTy+λI
*
5
已知坐标轴中两点A(2,−2)B(−1,2),这两点的曼哈顿距离(L1距离)为:
该题配额已满,无法继续作答,请联系发布者
A.
5
B.
25
C.
7
D.
1
*
6
关于特征x,y之间相关系数的描述正确的是
该题配额已满,无法继续作答,请联系发布者
A.
相关系数大于0,y随x的增大而减小
B.
相关系数大于0,y随x的增大而增大,或者y随x的减小而减小
C.
相关系数大于0,y随x的减小而增大
D.
以上描述均不对
*
7
用CART算法进行分类时,选择最优特征的最优划分点的准则是:
该题配额已满,无法继续作答,请联系发布者
A.
GINI系数
B.
样本方差
C.
误差平方和
D.
以上都不对
*
8
哪个是有监督学习技术
该题配额已满,无法继续作答,请联系发布者
A.
将邮件标记为垃圾邮件和非垃圾邮件,垃圾邮件过滤器
B.
在网上找一组新闻文章,把这些文章聚类为同一故事
C.
根据客户数据的数据库,自动发现市场细分市场,并将客户分成不同的细分市场
D.
对有相似习惯的用户推荐同类商品
*
9
在K-Means算法中,其中的K具体指的是什么()
该题配额已满,无法继续作答,请联系发布者
A.
样本个数
B.
代价值
C.
聚类个数
D.
迭代次数
*
10
以下哪些不能清洗脏数据?
该题配额已满,无法继续作答,请联系发布者
A.
缺失值填充
B.
重复值去除
C.
修正错误数据
D.
降维
*
11
关于kmeans具体的算法步骤组合正确的是: 1.随机选择K个中心点 2.把每个数据点分配到离它最近的中心点; 3.重新计算每类中的点到该类中心点距离的平均值; 4.分配每个数据到它最近的中心点; 5.重复步骤3和4,直到所有的观测值不再被分配或是达到最大的迭代次数。
该题配额已满,无法继续作答,请联系发布者
A.
12345
B.
13425
C.
21345
D.
41235
*
12
关于K-均值(K-means)聚类算法中的“k"描述正确的是:
该题配额已满,无法继续作答,请联系发布者
A.
类数
B.
迭代次数
C.
求k次均值
D.
以上都不对
*
13
K-均值算法中初始的K个质心怎么选
该题配额已满,无法继续作答,请联系发布者
A.
随机选
B.
必须按一定比列
C.
根据欧几里得距离
D.
以上都不对
*
14
在Pandas中,导出数据到CSV文件正确的是:
该题配额已满,无法继续作答,请联系发布者
A.
df.to_excel()
B.
df.to_sql()
C.
df.to_csv()
D.
df.to_json()
*
15
以下哪个算法对数据有降维的作用
该题配额已满,无法继续作答,请联系发布者
A.
决策树
B.
PCA
C.
线性回归
D.
多项式回归
*
16
以下不属于线性回归模型的是
该题配额已满,无法继续作答,请联系发布者
A.
Ridge Regression岭回归
B.
Lasso Regression套索回归
C.
Logistic Regression逻辑回归
D.
Linear Regression线性回归
*
17
以下哪个在PCA算法求解步骤中不会出现
该题配额已满,无法继续作答,请联系发布者
A.
求协方差矩阵
B.
求特征值和特征向量
C.
对数据中心化
D.
求梯度
*
18
以下哪个模型可以实现猫的分类
该题配额已满,无法继续作答,请联系发布者
A.
逻辑回归
B.
奇异值分解
C.
线性回归
D.
PCA
*
19
下列哪个算法需计算信息增益
该题配额已满,无法继续作答,请联系发布者
A.
Cart树
B.
ID3
C.
神经网络
D.
Ridge
*
20
L2正则化表示为
该题配额已满,无法继续作答,请联系发布者
A.
各个参数的平方和
B.
是模型参数中非零参数的个数
C.
各个参数绝对值之和
D.
以上都不对
*
21
随机森林中的“随机性”主要体现在()
该题配额已满,无法继续作答,请联系发布者
A.
样本随机
B.
维度随机
C.
参数随机
D.
弱分类器个数随机
*
22
主成分分析以最少的信息丢失为前提,将众多的原有变量综合成较少几个综合指标,通常综合指标(主成分)有以下几个特点:
该题配额已满,无法继续作答,请联系发布者
A.
主成分个数远远少于原有变量的个数
B.
主成分能够反映原有变量的绝大部分信息
C.
主成分之间应该互不相关
D.
主成分具有命名解释性
*
23
Adaboost中有两种权重,体现在()
该题配额已满,无法继续作答,请联系发布者
A.
样本权重
B.
代价函数
C.
梯度下降
D.
弱分类器权重
*
24
下列哪些算法属于集成学习:
该题配额已满,无法继续作答,请联系发布者
A.
线性回归
B.
bagging
C.
boosting
D.
stacking
*
25
聚类(clustering),就是根据数据的“相 似性”将数据分为多类的过程。估算两个不同样本之间的相似性,通常使用的方法就是计算两个 样本之间的“距离”,最常用的就包含以下哪些“距离”:
该题配额已满,无法继续作答,请联系发布者
A.
欧式距离
B.
马氏距离
C.
曼哈顿距离
D.
余弦距离
*
26
K-means算法中判断每个点归属哪个质心的距离怎么算
该题配额已满,无法继续作答,请联系发布者
A.
欧几里德距离
B.
余弦相似度
C.
曼哈顿距离
D.
明可夫斯基距离
*
27
关于sklearn.cluster.KMeans 参数介绍正确的是:
该题配额已满,无法继续作答,请联系发布者
A.
n_clusters:整形,缺省值=8 【生成的聚类数,即产生的质心(centroids)数
B.
init:初始化质心的选取方式,主要有下面三种参数可选,‘k-means++’、‘random’ or an ndarray,默认是'k-means++'
C.
n_init:随机初始化的次数,kmeans质心迭代的次数
D.
max_iter:最大迭代次数,默认是300
*
28
主成分分析以最少的信息丢失为前提,将众多的原有变量综合成较少几个综合指标,通常综合指标(主成分)有以下几个特点:
该题配额已满,无法继续作答,请联系发布者
A.
主成分个数远远少于原有变量的个数
B.
主成分能够反映原有变量的绝大部分信息
C.
主成分之间应该互不相关
D.
主成分具有命名解释性
*
29
下列哪些数据特性都是对聚类分析具有很强影响的:
该题配额已满,无法继续作答,请联系发布者
A.
高维性
B.
规模
C.
稀疏性
D.
噪声和离群点
*
30
以下哪些不能用来降维
该题配额已满,无法继续作答,请联系发布者
A.
线性回归
B.
PCA
C.
SVD分解
D.
决策树
*
31
关于L1和L2说法正确的是:
该题配额已满,无法继续作答,请联系发布者
A.
L1正则化对应scikit-learn中的套索回归
B.
L2正则化对应scikit-learn中的岭回归
C.
L2正则化对应scikit-learn中的套索回归
D.
L1正则化对应scikit-learn中的岭回归
*
32
决策树算法常用来做聚类。
该题配额已满,无法继续作答,请联系发布者
A.
正确
B.
错误
*
33
C4.5与CART既可以用于分类,又可以用于回归。
该题配额已满,无法继续作答,请联系发布者
A.
正确
B.
错误
*
34
逻辑回归可以用来做垃圾邮件分类。
该题配额已满,无法继续作答,请联系发布者
A.
正确
B.
错误
*
35
随机森林在对决策树进行bagging的基础上,在决策树的训练过程中引入了随机属性选择。
该题配额已满,无法继续作答,请联系发布者
A.
正确
B.
错误
*
36
聚类(Clustering)是一种无监督学习(unsupervised learning),简单地说就是把相似的对象归到同一簇中。
该题配额已满,无法继续作答,请联系发布者
A.
正确
B.
错误
*
37
K-均值算法中的“K”与KNN算法中的“K"指的是同一种概念。
该题配额已满,无法继续作答,请联系发布者
A.
正确
B.
错误
*
38
朴素贝叶斯的思想是这样的: 如果一个事物在一些属性条件发生的情况下,事物属于A的概率>属于B的概率,则判定事物属于A。
该题配额已满,无法继续作答,请联系发布者
A.
正确
B.
错误
*
39
朴素贝叶斯分类算法中“朴素”的意思是条件概率独立性。
该题配额已满,无法继续作答,请联系发布者
A.
正确
B.
错误
*
40
在机器学习和统计应用中,降维是指在计算时减少随机变量数目的处理过程,并且可以分为特征选择和特征提取。
该题配额已满,无法继续作答,请联系发布者
A.
正确
B.
错误
答题卡
已答0
未答40
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40