扫码填写或分享
0%
第十五单元
*
1
已知坐标轴中两点A(2,−2)B(−1,2),求这两点的切比雪夫距离
该题配额已满,无法继续作答,请联系发布者
A.
3
B.
4
C.
5
D.
7
*
2
查看行数和列数用到的方法是
该题配额已满,无法继续作答,请联系发布者
A.
df.head(n)
B.
df.tail(n)
C.
df.shape()
D.
df.info()
*
3
不属于数据清洗的方法是
该题配额已满,无法继续作答,请联系发布者
A.
缺失值填充
B.
重复值去除
C.
寻找离群点(奇点)
D.
集成不同的数据库
*
4
已知a(3,8,4,2),b(1,2,2,4)两点的中心坐标为?
该题配额已满,无法继续作答,请联系发布者
A.
(0.5,7,2,1)
B.
(5,3,1,2)
C.
(2,5,3,3)
D.
(0.5,3,0,4)
*
5
()是回归模型的评估指标
该题配额已满,无法继续作答,请联系发布者
A.
R2
B.
recall
C.
f1
D.
precision
*
6
已知坐标轴中两点A(2,−2)B(−1,2),求这两点的曼哈顿距离
该题配额已满,无法继续作答,请联系发布者
A.
6
B.
8
C.
9
D.
7
*
7
k-means中的k是什么()
该题配额已满,无法继续作答,请联系发布者
A.
样本个数
B.
代价值
C.
聚类个数
D.
以上都不对
*
8
机器学习算法分为很多种,哪种可以预测离散因变量?
该题配额已满,无法继续作答,请联系发布者
A.
单变量线性回归
B.
逻辑回归
C.
多变量线性回归
D.
多项式回归
*
9
向量 X=[0,4,-3,4,0,0] 的 L1 范数为
该题配额已满,无法继续作答,请联系发布者
A.
2
B.
3
C.
11
D.
5
*
10
L2正则化表示为
该题配额已满,无法继续作答,请联系发布者
A.
各个参数的平方和
B.
是模型参数中非零参数的个数
C.
各个参数绝对值之和
D.
以上都不对
*
11
对于列表ls的操作,以下选项中描述错误的是
该题配额已满,无法继续作答,请联系发布者
A.
ls.clear():删除ls的最后一个元素
B.
ls.copy():生成一个新列表,复制ls的所有元素
C.
ls.reverse():列表ls的所有元素反转
D.
ls.append(x):在ls最后增加一个元素
*
12
在样本量非常少,而特征特别多的情况下,以下哪种算法具有特征选择的作用:
该题配额已满,无法继续作答,请联系发布者
A.
SVM
B.
线性回归
C.
神经网络
D.
lasso回归
*
13
正则化除了可以简化模型,还能解决()
该题配额已满,无法继续作答,请联系发布者
A.
防止欠拟合
B.
导致过拟合
C.
防止过拟合
D.
导致欠拟合
*
14
以下选项中,不是建立字典的方式是
该题配额已满,无法继续作答,请联系发布者
A.
d = {[1,2]:1, [3,4]:3}
B.
d = {(1,2):1, (3,4):3}
C.
d = {'张三':1, '李四':2}
D.
d = {1:[1,2], 3:[3,4]}
*
15
最容易陷入局部最优的是下列哪个无监督学习方法?
该题配额已满,无法继续作答,请联系发布者
A.
k-means聚类
B.
PCA
C.
SVM
D.
ID3
*
16
关于决策树,下列说法正确的是:
该题配额已满,无法继续作答,请联系发布者
A.
C4.5算法用信息增益率来选择属性
B.
ID3算法用信息增益率来选择属性
C.
C4.5使用基尼指数来选择划分属性
D.
CART决策树使用信息增益来选择划分属性
*
17
用CART算法进行分类时,选择最优特征的最优划分点的准则是:
该题配额已满,无法继续作答,请联系发布者
A.
GINI系数
B.
样本方差
C.
误差平方和
D.
以上都不对
*
18
关于 bootstrap ,下列描述正确的是:
该题配额已满,无法继续作答,请联系发布者
A.
从总的 M 个特征中,有放回地抽取 m 个特征(m < M)
B.
从总的 M 个特征中,无放回地抽取 m 个特征(m < M)
C.
从总的 N 个样本中,有放回地抽取 n 个样本(n < N)
D.
从总的 N 个样本中,无放回地抽取 n 个样本(n < N)
*
19
PCA特征值分解要求矩阵是()
该题配额已满,无法继续作答,请联系发布者
A.
方阵型矩阵
B.
适用m*n阶矩阵(m不等于n)
C.
适用任意类型矩阵
D.
以上都不对
*
20
我们建立一个5000个特征, 100万数据的机器学习模型. 我们怎么有效地应对这样的大数据训练:
该题配额已满,无法继续作答,请联系发布者
A.
我们随机抽取一些样本, 在这些少量样本之上训练
B.
我们可以试用在线机器学习算法
C.
我们应用PCA算法降维, 减少特征数
D.
以上都可以
*
21
有监督学习使用的算法主要包括
该题配额已满,无法继续作答,请联系发布者
A.
逻辑回归
B.
决策树
C.
支持向量机
D.
神经网络
*
22
下列哪些算法属于线性回归算法:
该题配额已满,无法继续作答,请联系发布者
A.
多变量线性回归
B.
岭回归
C.
Lasso回归
D.
逻辑回归
*
23
常用的距离度量方法包括:
该题配额已满,无法继续作答,请联系发布者
A.
欧几里得空间距离
B.
Manhattan Distance
C.
Chebyshev distance
D.
以上都不对
*
24
Python中,以下哪些数据类型可变
该题配额已满,无法继续作答,请联系发布者
A.
列表
B.
字典
C.
元组
D.
字符串
*
25
对于缺失值存在多种处理方法,其中包括
该题配额已满,无法继续作答,请联系发布者
A.
删除缺失值
B.
用均值填充
C.
用众数填充
D.
数据标准化
*
26
Python 可以作为编程的入门语言,因为他具备以下特质
该题配额已满,无法继续作答,请联系发布者
A.
面向对象
B.
语法简洁
C.
开源
D.
丰富的社区资源
*
27
随机森林的构建步骤主要包含以下哪些方面:
该题配额已满,无法继续作答,请联系发布者
A.
从原始数据集中随机有放回采样选出m个样本,共进行n_tree次采样
B.
特征的随机筛选
C.
对于n_tree个训练集,我们分别训练n_tree个决策树模型
D.
对高维数据降维
*
28
关于Python 中的位运算符描述正确的是:
该题配额已满,无法继续作答,请联系发布者
A.
与 (&) 返回按位与结果
B.
或 (|) 返回按位或结果
C.
异或 (^) 返回按位异或结果
D.
取反 (~) 返回按位取反结果
*
29
下列哪些说法描述的是随机森林的缺点:
该题配额已满,无法继续作答,请联系发布者
A.
当随机森林中的决策树个数很多时,训练时需要的空间和时间会较大
B.
相比决策树更难以解释其决策过程
C.
无法用于回归
D.
需要计算每个弱分类器的权重
*
30
除十进制以外,在 Python 中还可以使用:
该题配额已满,无法继续作答,请联系发布者
A.
二进制
B.
八进制
C.
十六进制
D.
四进制
*
31
与线性回归不同,逻辑回归主要用于解决分类问题。
该题配额已满,无法继续作答,请联系发布者
A.
正确
B.
错误
*
32
Sigmoid函数可以把任何连续的值映射到[0,1]之间。
该题配额已满,无法继续作答,请联系发布者
A.
正确
B.
错误
*
33
逻辑回归是一种简单,常见的二分类模型。
该题配额已满,无法继续作答,请联系发布者
A.
正确
B.
错误
*
34
机器学习分为监督学习和非监督学习。
该题配额已满,无法继续作答,请联系发布者
A.
正确
B.
错误
*
35
逻辑回归虽然带有回归字样,但是逻辑回归属于分类算法。
该题配额已满,无法继续作答,请联系发布者
A.
正确
B.
错误
*
36
特征选择是一个重要的数据预处理过程。
该题配额已满,无法继续作答,请联系发布者
A.
正确
B.
错误
*
37
降维是一种通过分析出主变量来减少特征变量的过程,其中主变量通常就是重要的特征。
该题配额已满,无法继续作答,请联系发布者
A.
正确
B.
错误
*
38
数据规范化在预处理阶段尤为重要,它可以将数值缩放到特定的范围,以在反向传播时获得更好的收敛性。
该题配额已满,无法继续作答,请联系发布者
A.
正确
B.
错误
*
39
随机森林在对决策树进行Boosting的基础上,在决策树的训练过程中引入了随机属性选择。
该题配额已满,无法继续作答,请联系发布者
A.
正确
B.
错误
*
40
概率模型不需要归一化,因为它们不关心变量的值,而是关心变量的分布和变量之间的条件概率,如决策树、RF。
该题配额已满,无法继续作答,请联系发布者
A.
正确
B.
错误
答题卡
已答0
未答40
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40