数据分析答案_关于groupby对象,下列描述正确的是-优快云博客

本文链接：https://blog.youkuaiyun.com/2301_79736018/article/details/140035885

下列选项中，用于搭接数据仓库和保证数据质量的(B.数据处理)

下列选项中，用于删除缺失值的方法是(B.delete())

下列选项中，用于绘制单变量分布的函数是(A.displot())

下列选项中，用于绘制双变量分布的函数是(B.joinplot())

下列选项中，用于标注词语词性的模块是(D.nltk.tag)

下列选项中，用来表示矢量化三元表达式的是(A.where())

下列选项中，用来表示时间序列中的频率为每小时的是(D.H)

下列选项中，用来表示时间序列中的频率为每周六的(D.W-SAT)

下列选项中，用来表示Pandas中的时期的是(A.Period)

下列选项中，不属于ndarray对象属性的是(D.map)

下列选项中，不属于groupby()方法分组方式的是(D.集合)

下列选项中，不属于Seaborn中分类数据可视化库的是(D.分类数据的直方图)

下列选项中，不能创建一个Series对象的是(D.ser_obj=pd.Series(1,2))

下列选项中，关于dropna()方法描述正确的是(C.dropna()方法会删除值为None和NaN的数据)

下列选项中，关于fillna()方法描述正确的是(D.fillna()方法可以填充替换值为 NaN 和 None的数据)

下列选项中，关于drop_duplicates()方法描述错误的是(A.仅支持单一特征数据的去重)

下列选项中，可以一次性创建多个子图的是(D.subplots())

下列选项中，主要用来获得根词的是(A.WordNetLemmatizer)

下列选项中，NLTK 用来标记形容词的是(A.JJ)

下列选项中，(A.Jupyter Notebook)基于Web的交互式计算环境

下列函数中，用于打开NLTK下载器的是(A.download())

下列函数中，用于计算整数的绝对值的是(C.abs())

下列函数中，用于计算对角线元素和的是(C.trace ())

下列函数中，用于沿着轴方向堆叠Pandas对象的是(A.concat())

下列函数中，用于保存当前生成的图表的是(C.savefig())

下列函数中，可以为图表设置标题的是(C.title())

下列函数中，可以为图表设置图例的是(A.legend())

下列函数中，可以用于创建等差数组的函数是(B.arange())

下列函数中，可以设置当前图形x轴范围的是(B.xlim())

下列函数中，属于二元通用函数的是(C.add())

下列图表中，适用于比较跨类别数据的是(D.散点图)

下列图表中，可以清晰地反映出各数据系列的百分比情(C.饼图)

下列图表中，可以清晰地反映出数据变化趋势的是(B.折线图)

下列图表中，能够识别异常值的是(A.箱形图)

下列pyplot模块的函数中，可以绘制条形图的是(A.bar())

下列pyplot模块的函数中，可以绘制直方图的是(B.hist())

下列pyplot模块的函数中，可以绘制饼图的是(C.pie())

下列pyplot模块的函数中，可以绘制散点图的是(D.scatter())

下列关于数据预处理的说法中，描述不正确的是(D.concat()函数可以根据一个或多个键将不同的DataFrame进行合并)

下列关于数据分析概念的描述错误的是(D.数据分析不能够在杂乱无章的数据中提取有用的数据)

下列关于数组运算的描述错误的是(D.数组不支持算术运算符与标量之间的运算)

下列关于Bokeh库描述不正确的是(C.不适用于大量的数据集)

下列关于DataFrame说法正确的是(A.DataFrame结构是由索引和数据组成)

下列关于ndarray对象描述正确的是(B.ndarray对象中存储元素的类型必须是相同的)

下列关于ndarray对象索引的描述错误的是(D.ndarray对象的多维数组索引和切片的使用方式与列表的使用方式完全相同)

下列关于Pandas库的说法中正确的是(C.Pandas是在NumPy基础上建立的新程序库)

下列关于groupby()方法的说法中，描述正确的是(C.调用groupby()方法返回一个GroupBy 对象)

下列方法中，能够转换时期频率的是(C.asfreq())

下列方法中，能够对常规时间序列数据重新采样(D.resample())

下列方法中，用来创建一个滑动窗口的是(B.rolling())

下列方法中，可以将元组转换为MultiIndex对象的是(A.from_tuples())

下列方法中，用于返回出现相对较频繁的单(C.most_common())

下列参数中，调整后显示中文的是(C.font.sans-serif)

下列代码中，绘制散点图的是(A.plt.scatter(x,y))

下列的数组统计计算中，用于计算数组中最大值的方法(A.max)

下列关于常见图表说法正确的是(C.折线图可以用作查看特征间的趋势关系)

下列nltk模块中，可以对句子实现分词操作的是(B.nltk.tokenize)

下列分词模式中，可以将句子中所有成词词语都扫描出来的是(B.全模式)

关于数据重塑的说法中，下列选项描述错误的是(C.对一个DataFrame使用stack()方法后返回的一定是一个Series)

关于数组运算的说法中，下列描述错误的是(D.广播机制需要扩展维度大的数组)

关于数据分析的说法，下列描述错误的是(C.数据分析没有实际的使用意义)

关于词性归一化的说法中，下列描述正确的是(D.词形还原能够捕捉基于词根的规范单词形式)

关于Pandas中数据排序，下列说法正确的是(A.即可以按照行索引排序，也可以按照列索引排序)

关于Pandas层次化索引，下列说法错误的是(B.层次化索引至多只能有两层索引)

关于Anaconda组件的说法中，下列描述错误的是(B.Jupyter Notebook 是基于客户端的交互式计算环境，可以编辑易于人们阅读的文档，用于展示数据分析的过程)

关于agg()方法的使用中，下列描述错误的是(A.agg()方法中func参数只能传入一个函数)

关于agg()方法的用法中，下列描述错误的是(C.每列的数据只能使用相同的函数)

关于apply()方法的说法中，下列描述正确的是(A.apply()方法是对DataFrame)

关于apply()方法的功能，下列选项中说法正确的是(A.apply()方法是对DataFrame)

关于时间序列的移动，下列说法错误的是(B.时间序列移动后，索引也会发生变化)

关于预处理的说法中，下列选项中描述不正确是(D.unstack()方法可以将列索引旋转为行索引)

关于降采样的说法中，下列描述错误的是(C.降采样的数据量是增加的)

关于异常值的说法，下列选项中描述错误的是(A、异常值是指样本中明显偏离其余观测值的个别值)

关于创建ndarray对象。下列描述错误的是(A.使用 list()函数可以创建一个ndarray对象)

关于哑变量的说法中，下列选项描述错误的是(D.哑变量的使用没有实际意义)

关于分组聚合过程的说法中，下列描述不正确的是(D.只能对纵轴方向上的数据进行分组)

关于文本预处理的过程，下列描述错误的是(D.文本中的每个单词都能够表明文本的特征)

关于Anaconda的组件中，可以编辑文档且展示数据分析过程的是(D.Jupyter Notebook)

关于ndarray对象属性，下列描述错误的是(C.size属性表示数组元素的总个数，等shape属性元组元素的和)

关于Series结构，下列描述正确的是(B.Series由一组数据和与之相关的索引两部分构成)

关于Matplotlib的说法中，下列描述正确的是(B.它使用简单，仅用几行代码就能生成各种图表)

关于groupby()方法的返回值，下列说法错误的是(D.groupby()方法没有返回值)

关于transform()方法的说法中，下列描述错误的是(C.transform()方法只能使用内置方法对数据进行转换操作)

在进行算术运算时，如果希望一次性输出多个统计指标可以使用(B.describe())方法

在创建ndarray对象时，可以使用(A.dtype)参数来指定元素类

在创建Figure对象时，可以指定哪个参数来设置画布的尺寸(C.figsize)

在创建Figure对象时，可以指定哪个参数来给画布添加背景颜色(D.facecolor)

在NumPy通用函数中，用于计算元素级最大值的函数是(B.maximum)

在NumPy模块中表示生成随机种子的函数是(A.seed())

通过 date_range()函数创建DatetimeIndex对象时，可以设置哪个参数指定起始日期(D.start)

通过 date_range()函数创建DatetimeIndex对象时，可以设置哪个参数指定终止日期(C.end)

通过 date_range()函数创建DatetimeIndex对象时，可以设置哪个参数指定产生多少个时间戳索引值(B.periods)

通过date_range()函数创建DatetimeIndex对象时，可以设置哪个参数来改变计时单位(A.freq)

通过date_range()函数创建DatetimeIndex对象时，可以设置(A.normalize)参数来规范时间戳

通过date_range()函数创建DatetimeIndex对象时，如果只是传入了开始日期，则还需要用(C.periods)参数指定产生多少个

请阅读下面一段程序：period=pd.Period("2011-01") other_period = pd.Period("2012/06") print(period-other_period)运行上述程序，它最终输出的结果为(B.-17)

请阅读下面一段程序：period=pd.Period(2010)print(period+5)运行上述程序，它最终输出的结果为(A.2015)

请阅读下面一段程序：import numpy as npnp.arange(1, 10, 3)运行程序，最终执行的结果是(B.array([1, 4, 7]))

请阅读下面一段程序：arr2d=np.empty((4, 4))for i in range(4): arr2d[i]=np.arange(i, i+4)arr2d[[0,4],[3,1]]执行上述程序，它最终输出的结果为(B.程序抛出IndexError异常)

请阅读下面一段程序：import pandas as pdser_obj=pd.Series([1, 2, 3,], index=['c', 'd', 'a'])ser_obj2=ser_obj.reindex(['a', 'b', 'c', 'd'])print(ser_obj2)执行上(C.a 3.0b NaNc 1.0d 2.0)

请阅读下面一段程序：import pandas as pd date_index=pd.to_datetime(['20180908', '20181008', '20181108'])date_index[2]运行上述程序，它最终执行的结果为(A.Timestamp('2018-11-08 00:00:00'))

请阅读下面一段程序：import pandas as pd import numpy as np date_list = ['2015/06/01', '2017/02/01','2016.6.1','2018.6.1'] date_index=pd.to_datetime(date_list) date_se=pd.Series(np.arange(4), index=date_index)date_se[3]运行程序，它最终执行的结果为(B.3)

请阅读下面一段程序：import pandas as pd import numpy as np from datetime import datetime date_list = ['2015/06/01', '2016/02/01','2016.6.1','2018.6.1'] date_index = pd.to_datetime(date_list)date_se = pd.Series(np.arange(4), index=date_index)若需要获取 2016-06-01对应的数据，则下列选项中可以填写到横线处的是(C、date_se[datetime(2016, 6, 1)])

请阅读下面一段程序：roll_window=ser_obj.rolling(window=10)有关上述程序，下面描述错误的是(A.roll_window是一个Period类对象)

请阅读下列一段示例程序：arr2d=np.array([[11, 20, 5],[21, 15, 26],[17, 8, 19]])arr2d[0:2, 0:2]运行上述程序，它最终执行的结果为(A.array([[11, 20],[21, 15]]))

请阅读下列一段示例程序：import numpy as np arr1=np.array([[0], [1], [2]]) arr2=np.array([1, 2]) result=arr1+arr2 print(result.shape)运行上述程序，输出的结果为(A.(3, 2))

请阅读下列一段程序：arr=np.arange(12).reshape(3, 4)arr.shape运行上述程序，它最终执行的结果为(C.(3, 4))

创建DatetimeIndex对象的代码如下：pd.date_range(start='2018/2/1', end='2018/2/28',fre=__)如果希望生成的时间戳为每周日，则下列选项中可以填写到横线处的是(C.W-SUN)

创建一个DatetimeIndex对象的代码如下：pd.date_range('2018/08/10', '2018/08/15')默认情况下，该对象中时间戳的频率为(B.D)

已知，有如下一个二维数组：arr2d=np.array([[1, 2, 3],[4, 5, 6],[7, 8, 9]])如果希望获取元素5，则可以使用(A.arr2d[1, 1])实现

请看如下代码：import numpy as np arr=np.array([[6, 2, 7],[3, 6, 2], [4, 3, 2]]) arr.sort() arr对代码中的 NumPy数组执行 sort()方法结果正确的是(A.array([[2, 6, 7],[2,3, 6],[2, 3, 4]]))

要想创建一个3*4的数组，下列选项正确的是(B.np.arange(12).reshape(3, 4)<