单选题
1、Windows系统不能进行数据爬虫。
A.正确
B.错误
2、自然语言处理是一门融语言学、计算机科学、心理学于一体的科学。
A.正确
B.错误
3、文本分类是指将文本按照内容的不同判别到一个或多个预先确定的文本类别之中的过程。
A.正确
B.错误
4、中文分词只局限于中文应用。
A.正确
B.错误
5、删除缺失值的行和填充缺失值是处理缺失值的主要技巧。
A .正确
B.错误
6、噪声数据只能自然产生不能人工形成。
A.正确
B.错误
7、人脸解析,是将人的头部包含人脸五官构成进行分解,得到头发、面部皮肤、眼睛、眉毛、鼻子、嘴、耳朵等区域。
A.正确
B.错误
8、数据类型是语言的抽象原子概念,可以说是语言中最基本的单元定义。
A.正确
B.错误
9、只能阅卷、机器阅读理解不能运用自然语言处理技术。
A .正确
B.错误
10、数据预处理的主要流程包括数据清理、数据集成、数据变换和数据规约。
A .正确
B.错误
11、语义标注的质量标准是标注出词语或语句的语义。
A.正确
B.错误
12、数据规约一定不会减少原数据的信息量。
A .正确
B.错误
13、数据集成涉及数据值冲突的是()。
A.文本分析
B.视频分析
C.检测与处理
D.动画编辑
14、去掉噪声属于()。
A .数据预处理
B.文本分析
C.模式识别
D.模型构建
15、通过一组符号及其组合来描述事物的是()。
A .数据
B.信息
C.知识
D.文字
16、()包含人脸检测与属性分析、人脸对比、人脸搜索等。
A.人脸识别
B.数据挖掘
C.机器学习
D .深度学习
17、网页数据可能包含文本数据、()等。
A .图片数据
B.玩具实体模型
C.实体书
D.纸质书
18、数据采集的常见误差来源有( )。
A.系统误差、随机误差和测量误差
B.选择误差、测量误差和数据处理误差
C.调查误差、测量误差和数据处理误差
D.系统误差、随机误差、测量误差和数据处理误差
19、热爱并以恭敬严肃的态度对待自己的本职工作是( )的表现
A.遵纪守法
B.爱岗敬业
C.团结协作
D.勤奋进取
20、一人所属照片清洗工具通常是一种()标注工具,判断是否为同一个人。
A.二分类
B.三分类
C.多分类
D .简单
21、人工智能的核心是()。
A .机器学习
B.大数据
C.算法
D .深度学习
22、以下()不属于数据采集的步骤。
A .确定研究问题并设计调查方案
B.对收集到的数据进行编码和整理
C.对数据进行可视化以探索其分布
D.分析数据并得出结论
23、人工神经网络模仿(),由许多人工神经元组成。
A.猩猩大脑
B.人类大脑
C.鲸鱼大脑
D.鲨鱼大脑
24、()包括数据质量控制和数据治理。