扫码填写或分享
0%
第十九单元
*
1
做一个项目的大致步骤,下列选项中正确的是

该题配额已满,无法继续作答,请联系发布者
*
2
在MapReduce中,并发所有的组件都一定使用,以下哪个组件不是必须的

*
3
hive1.2的trim (string A)函数的作用是

*
4
下列的选项中,关于hive的分桶,说法正确的是

*
5
以下哪个参数表示获取输入的参数个数,多用于循环?

*
6
以下哪个参数表示获取所有参数,按照个数?

*
7
如何查找出 /etc/my.conf 文件属于哪个包 (package)

*
8
liunx下网络连接有哪些

*
9
在hadoop集群中,HDFS是基于流数据模式访问和处理超大文件的需求而开发的,具有高容错.咖可靠性、高可扩展性、高吞吐率等特征,适合的读写任务是

*
10
在linux系统中,如果执行命令 chmod 746 file.txt,那么执行结束后fle.txt的权限是

*
11
不会对基本K-均值算法产生影响的因素是()

*
12
以下代码的作用是? import sys sys.path.append('/root/mydir/')

*
13
deque是一种( )数据结构

*
14
pandas方法中,将Series/Index中的字符串转换为大写的函数是

*
15
对数据的特征选择一般分为三类,下面哪项不包括:

*
16
在pandas应用方法中,以下说法不正确的是

*
17
在机器学习算法中,聚类技术的依据主要是基于

*
18
M(4,2,1),N(4,0,1),他们之间的欧式距离为

*
19
AUC值可以通过sklearn包中的哪个模块实现

*
20
结构风险最小化策略可以解决()问题

*
21
以下与PCA算法相关的是哪些

*
22
处理过拟合问题常用的方法有

*
23
以下()可以用来衡量分类算法的优劣

*
24
.Hadoop生态圈组件HDFS中NameNode进程的作用有哪些?

*
25
以下与奇异值分解相关的是哪些

*
26
关于C4.5算法描述正确的是:

*
27
对于随机森林中”随机“理解正确地是:

*
28
处理缺失值主要包括以下哪些?

*
29
在工程实践中,我们得到的数据会存在有缺失值、重复值等,在使用之前需要进行数据预处理。数据预处理没有标准的流程,通常针对不同的任务和数据集属性的不同而不同。数据预处理的常用流程为

*
30
特征编码也属于一种数据预处理方法,主要包括

*
31
梯度下降方法,只包含批量梯度下降和小批量梯度下降

*
32
Secondary namenode就是namenode出现问题时的备用节点

*
33
SVD分解只能对方阵进行分解

*
34
PCA属于线性降维方法,常用在特征工程中

*
35
在linux环境下,_代表符号链接文件

*
36
传统的线性回归模型(一组输入–输出对的线性逼近)通过最小化线性模型预测值与 训练样本输出值之间的平方误差和来找到可能的最好的实验数据线性拟合。

*
37
数据降维就是在保留重要信息的同时消除那些“无信息量的信息”。

*
38
在分类中,线性模型旨在用线条、平面与超平面来分离实例。

*
39
对于一件给定的事物,决策树通过连续地提出 关于其已知属性的问题来估计它的一个未知属性。

*
40
决策树是以层次的方式组织起来的一个问题集,并且用一棵树的图形来表示。

答题卡
已答0未答40
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40