数据科学库考核-matplotlib、numpy、pandas

这篇博客主要介绍了数据科学中numpy库和pandas库的编程考核点,包括创建ndarray对象、数据操作、正则化矩阵等。同时,详细阐述了Pandas数据处理的操作,如导入数据、查看基本信息、选择数据子集、处理缺失值以及进行数据列的选择和删除。此外,还提到了数据可视化中存在的一些常见错误。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

目录

(一)第一考核点:编程题

1.创建一个长度为10的一维全为0的ndarray对象,然后让第5个元素等于1

2.创建一个元素为从10到49的ndarray对象,使用随机整数完成

 3.将第2题的所有元素位置反转

4.用np.random.random创建一个10*10的ndarray对象,并打印出最大最小元素

5.创建一个范围在(0,1)之间的长度为12的等差数列

6.创建一个长度为10的随机数组并排序

7.创建一个长度为10的随机数组并将最大值替换为0 

8.正则化一个5*5随机矩阵

【正则的概念:假设a是矩阵中的一个元素,max/min分别是矩阵元素的最大最小值,则正则化后a = (a - min)/(max - min)】

9.检查dataframe是否有缺失值以及统计dataframe中每列缺失值的数量,数据如下: 

10、Pandas数据处理,数据如下

1.通过csv方式导入数据集

2. 查看数据的基本信息---占用多大内存,前3行、后三行、各字段描述信息

3.选择数据集前3行数据

4.选择数据集的前3列数据

5.选择数据集的1和3行数据,1和2列数据

6.使用3种方法实现选择前3行前3列数据的方式

7.选择is_date标签列的两种方法

8.选择"height":"job"两个列数据

9.选择最后一行

10.最后一行数据去掉is_date后的数据信息

11.删除is_date这一列的数据

12.查询出is_date=-1的这一列数据

 12、绘制以下图形(图中为cos,标记错误,知晓)


 

(一)第一考核点:编程题

1.创建一个长度为10的一维全为0的ndarray对象,然后让第5个元素等于1

In [1]: import numpy as np

In [2]: t1=np.zeros((1,10))

In [3]: t1
Out[3]: array([[0., 0., 0., 0., 0., 0., 0., 0., 0., 0.]])

In [4]: t1[0][4]=1

In [5]: t1
Out[5]: array([[0., 0., 0., 0., 1., 0., 0., 0., 0., 0.]])

2.创建一个元素为从10到49的ndarray对象,使用随机整数完成

In [15]: t2=np.random.randint(10,50,size=49) #

In [16]: t2
Out[16]:
array([24, 11, 34, 26, 26, 44, 12, 36, 45, 23, 23, 46, 41, 26, 37, 38, 49,
       18, 47, 41, 31, 24, 27, 14, 44, 44, 38, 16, 36, 35, 18, 35, 45, 16,
       22, 44, 13, 37, 42, 46, 17, 30, 43, 47, 48, 28, 23, 27, 13])

 3.将第2题的所有元素位置反转

In [18]: t3=t2[::-1] #

In [19]: t3
Out[19]:
array([13, 27, 23, 28, 48, 47, 43, 30, 17, 46, 42, 37, 13, 44, 22, 16, 45,
       35, 18, 35, 36, 16, 38, 44, 44, 14, 27, 24, 31, 41, 47, 18, 49, 38,
       37, 26, 41, 46, 23, 23, 45, 36, 12, 44, 26, 26, 34, 11, 24])

4.用np.random.random创建一个10*10的ndarray对象,并打印出最大最小元素

In [21]: t4=np.random.random(size=(10,10))

In [22]: t4
Out[22]:
array([[8.21038748e-01, 7.22597306e-01, 6.35004760e-01, 6.30278905e-01,
        7.21230897e-01, 1.45551717e-01, 4.21680378e-01, 6.94256860e-01,
        4.75163078e-01, 3.78272279e-01],
       [2.24963400e-01, 1.68455023e-01, 3.53772831e-01, 2.35938725e-01,
        9.67641407e-01, 6.75862785e-01, 6.87747294e-01, 9.00981999e-01,
        7.58865179e-01, 7.97948002e-01],
       [4.68217204e-01, 4.82410115e-01, 6.33489932e-01, 6.69848545e-01,
        3.55811030e-01, 7.10601572e-01, 9.73982045e-01, 8.48176270e-01,
        9.69379583e-01, 1.38494603e-01],
       [2.92866559e-01, 8.03101171e-01, 1.44894513e-04, 8.92936723e-01,
        8.31452039e-01, 2.44574513e-01, 9.13012457e-01, 4.55959156e-01,
        8.91557176e-01, 4.70604295e-01],
       [4.61874661e-01, 5.67882268e-01, 1.83838662e-01, 3.42681002e-01,
        1.86071919e-02, 8.85526983e-02, 3.07047370e-01, 4.84516109e-01,
        3.15094460e-04, 8.06711517e-01],
       [9.70274601e-01, 4.80280052e-01, 2.41837061e-01, 3.97089968e-01,
        4.06165611e-01, 5.18093903e-01, 5.22592066e-01, 7.13036082e-01,
        3.67582734e-01, 9.41866669e-01],
       [4.40699632e-01, 6.98142447e-01, 2.23398446e-01, 1.58402473e-01,
        3.05847039e-01, 8.16281696e-01, 9.97849493e-01, 4.71068381e-01,
        2.60841425e-01, 4.54424099e-01],
       [8.72116693e-01, 2.53424451e-01, 2.28433159e-01, 2.27822794e-01,
        1.23495091e-01, 1.34220369e-01, 7.90260375e-01, 4.20292929e-01,
        6.79454559e-01, 8.30187315e-01],
       [3.41908576e-01, 5.30555269e-01, 2.07606785e-01, 2.69860458e-01,
        5.04628172e-01, 4.35414313e-01, 7.54742041e-01, 9.29408049e-01,
        3.89093728e-01, 1.72039662e-01],
       [5.74903372e-02, 5.20853974e-01, 4.62071858e-01, 7.35976749e-01,
        2.08357038e-01, 7.47241503e-01, 9.16261517e-01, 1.56101167e-01,
        8.90492151e-01, 5.00361162e-02]])

In [23]: t4max=t4.max()

In [24]: t4max
Out[24]: 0.9978494934269526

5.创建一个范围在(0,1)之间的长度为12的等差数列

In [25]: t5=np.linspace(0,1,12)  #
 
In [26]: t5
Out[26]:
array([0.        , 0.09090909, 0.18181818, 0.27272727, 0.36363636,
       0.45454545, 0.54545455, 0.63636364, 0.72727273, 0.81818182,
       0.90909091, 1.        ])

6.创建一个长度为10的随机数组并排序

In [27]: t6=np.random.randint(1,100,10)  

In [28]: t6.sort()  #排序

In [29]: t6
Out[29]: array([19, 29, 45, 45, 51, 53, 68, 74, 78, 81])

7.创建一个长度为10的随机数组并将最大值替换为0 

In [38]: t7=np.random.randint(1,100,10) 
In [39]: t7
Out[39]: array([
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值