扫码填写或分享
0%
第十九单元
*
1
做一个项目的大致步骤,下列选项中正确的是
该题配额已满,无法继续作答,请联系发布者
*
2
在MapReduce中,并发所有的组件都一定使用,以下哪个组件不是必须的
该题配额已满,无法继续作答,请联系发布者
A.
1.系统设计阶段2.需求分析阶段3.编码阶段 4.测试阶段
B.
1.测试阶段2.需求分析阶 段 3.编码阶段4.系统设 计阶段
C.
1.需求分析阶段2.系统设计阶段3.编码阶段4.测试阶段
D.
1.编码阶段2.需求分析阶 段 3.系统设计阶段 4.测 试阶段
*
3
hive1.2的trim (string A)函数的作用是
该题配额已满,无法继续作答,请联系发布者
A.
Partitioner
B.
OutputFormat
C.
Combiner
D.
InputFormat
*
4
下列的选项中,关于hive的分桶,说法正确的是
该题配额已满,无法继续作答,请联系发布者
A.
查看重复N次字符 串
B.
删除字符串两 边的空格,中 间的会保留
C.
查看当前系统时 间
D.
拼接字符串
*
5
以下哪个参数表示获取输入的参数个数,多用于循环?
该题配额已满,无法继续作答,请联系发布者
A.
分桶是为了把数据分配到不同的文件中
B.
创建带桶的表的语法是: partitioned by
C.
分桶后会产生更多的二级目录
D.
分桶越多越好
*
6
以下哪个参数表示获取所有参数,按照个数?
该题配额已满,无法继续作答,请联系发布者
A.
1
B.
$n
C.
0
D.
$#
*
7
如何查找出 /etc/my.conf 文件属于哪个包 (package)
该题配额已满,无法继续作答,请联系发布者
A.
1
B.
$@
C.
$*
D.
$#
*
8
liunx下网络连接有哪些
该题配额已满,无法继续作答,请联系发布者
A.
rpm -g /etc/my.conf
B.
rpm -requires /etc/my.conf
C.
rpm -gf /etc/my.conf
D.
rpm -q I grep /etc/my.conf
*
9
在hadoop集群中,HDFS是基于流数据模式访问和处理超大文件的需求而开发的,具有高容错.咖可靠性、高可扩展性、高吞吐率等特征,适合的读写任务是
该题配额已满,无法继续作答,请联系发布者
A.
nat模式
B.
千行模式
C.
自己模式
D.
网络模式
*
10
在linux系统中,如果执行命令 chmod 746 file.txt,那么执行结束后fle.txt的权限是
该题配额已满,无法继续作答,请联系发布者
A.
一次写入,少次读
B.
多次写入,少次读
C.
多次写入,多次读
D.
一次写入,多次读
*
11
不会对基本K-均值算法产生影响的因素是()
该题配额已满,无法继续作答,请联系发布者
A.
rwxr--rw-
B.
rw-r-r--
C.
rwxr--r--
*
12
以下代码的作用是? import sys sys.path.append('/root/mydir/')
该题配额已满,无法继续作答,请联系发布者
A.
样本输入顺序
B.
模式相似性测度
C.
聚类准则
D.
初始类中心的选取
*
13
deque是一种( )数据结构
该题配额已满,无法继续作答,请联系发布者
A.
改变python的启动路径
B.
改变python目前的工作路径
C.
添加一个新的python模块的搜索路径
D.
从/root/mydir中移除所有的文件夹
*
14
pandas方法中,将Series/Index中的字符串转换为大写的函数是
该题配额已满,无法继续作答,请联系发布者
A.
Heap
B.
Stack
C.
队列
D.
双端队列
*
15
对数据的特征选择一般分为三类,下面哪项不包括:
该题配额已满,无法继续作答,请联系发布者
A.
upper()
B.
lower()
C.
replace()
D.
len()
*
16
在pandas应用方法中,以下说法不正确的是
该题配额已满,无法继续作答,请联系发布者
A.
过滤式(filter)
B.
包裹式(wrapper)
C.
嵌入式(embedding)
D.
稀疏编码
*
17
在机器学习算法中,聚类技术的依据主要是基于
该题配额已满,无法继续作答,请联系发布者
A.
读取csv文件,获得DataFrame数据结构:data = pd.read_csv('filename.csv',header=None)
B.
DataFrame数据结构保存为csv文件:data.to_csv('filename.csv',header=None,index=False)
C.
split():用给定的模式拆分每个字符串
D.
replace(a,b):将值b替换为值a
*
18
M(4,2,1),N(4,0,1),他们之间的欧式距离为
该题配额已满,无法继续作答,请联系发布者
A.
特征的均值
B.
距离度量
C.
似然值
D.
特征的方差
*
19
AUC值可以通过sklearn包中的哪个模块实现
该题配额已满,无法继续作答,请联系发布者
A.
1
B.
2
C.
4
D.
3
*
20
结构风险最小化策略可以解决()问题
该题配额已满,无法继续作答,请联系发布者
A.
metrics
B.
preprocessing
C.
workspace
D.
project
*
21
以下与PCA算法相关的是哪些
该题配额已满,无法继续作答,请联系发布者
A.
过拟合
B.
欠拟合
C.
收敛过慢
D.
以上都不对
*
22
处理过拟合问题常用的方法有
该题配额已满,无法继续作答,请联系发布者
A.
协方差
B.
协方差矩阵
C.
特征值
D.
特征向量
*
23
以下()可以用来衡量分类算法的优劣
该题配额已满,无法继续作答,请联系发布者
A.
减少特征数量 主要方法有:人工的挑选重要的特征,去除不重要的特征。
B.
正则化(regularization) 保留所有特征,但是减少参数的值
C.
正则化(regularization) 保留所有特征,但是增大参数的值
D.
增大特征数量
*
24
.Hadoop生态圈组件HDFS中NameNode进程的作用有哪些?
该题配额已满,无法继续作答,请联系发布者
A.
精确率
B.
召回率
C.
均方误差
D.
R方
*
25
以下与奇异值分解相关的是哪些
该题配额已满,无法继续作答,请联系发布者
A.
管理元数据
B.
存放数据块
C.
维护目录树
D.
响应客户请求
*
26
关于C4.5算法描述正确的是:
该题配额已满,无法继续作答,请联系发布者
A.
左奇异向量
B.
右奇异向量
C.
奇异值
D.
协方差矩阵
*
27
对于随机森林中”随机“理解正确地是:
该题配额已满,无法继续作答,请联系发布者
A.
克服了用用信息增益选择属性时偏向选取值多的属性的不足
B.
在树构造过程中进行了剪枝
C.
使用基尼指数来选择划分属性
D.
能够完成对连续性属性的离散化处理
*
28
处理缺失值主要包括以下哪些?
该题配额已满,无法继续作答,请联系发布者
A.
数据的随机性化
B.
待选特征的随机化
C.
结果的随机性
D.
方法的随机性
*
29
在工程实践中,我们得到的数据会存在有缺失值、重复值等,在使用之前需要进行数据预处理。数据预处理没有标准的流程,通常针对不同的任务和数据集属性的不同而不同。数据预处理的常用流程为
该题配额已满,无法继续作答,请联系发布者
A.
直接使用含有缺失值的特征
B.
删除含有缺失值的特征
C.
缺失值补全
D.
数据展现
*
30
特征编码也属于一种数据预处理方法,主要包括
该题配额已满,无法继续作答,请联系发布者
A.
数据标准化、正则化
B.
特征选择
C.
主成分分析
D.
处理缺失值重复值
*
31
梯度下降方法,只包含批量梯度下降和小批量梯度下降
该题配额已满,无法继续作答,请联系发布者
A.
正确
B.
错误
C.
数据标准化
D.
以上都对
*
32
Secondary namenode就是namenode出现问题时的备用节点
该题配额已满,无法继续作答,请联系发布者
A.
正确
B.
错误
*
33
SVD分解只能对方阵进行分解
该题配额已满,无法继续作答,请联系发布者
A.
正确
B.
错误
*
34
PCA属于线性降维方法,常用在特征工程中
该题配额已满,无法继续作答,请联系发布者
A.
正确
B.
错误
*
35
在linux环境下,_代表符号链接文件
该题配额已满,无法继续作答,请联系发布者
A.
正确
B.
错误
*
36
传统的线性回归模型(一组输入–输出对的线性逼近)通过最小化线性模型预测值与 训练样本输出值之间的平方误差和来找到可能的最好的实验数据线性拟合。
该题配额已满,无法继续作答,请联系发布者
A.
正确
B.
错误
*
37
数据降维就是在保留重要信息的同时消除那些“无信息量的信息”。
该题配额已满,无法继续作答,请联系发布者
A.
正确
B.
错误
*
38
在分类中,线性模型旨在用线条、平面与超平面来分离实例。
该题配额已满,无法继续作答,请联系发布者
A.
正确
B.
错误
*
39
对于一件给定的事物,决策树通过连续地提出 关于其已知属性的问题来估计它的一个未知属性。
该题配额已满,无法继续作答,请联系发布者
A.
正确
B.
错误
*
40
决策树是以层次的方式组织起来的一个问题集,并且用一棵树的图形来表示。
该题配额已满,无法继续作答,请联系发布者
A.
正确
B.
错误
答题卡
已答0
未答40
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40