
pandas
文章平均质量分 74
pandas知识
NJU_AI_NB
这个作者很懒,什么都没留下…
展开
-
利用pandas库进行数据分析(四)
5. 使用`groupby`方法按照'cate'列进行分组,然后对每个分组使用`count`方法计算'title'列的数量。6. 遍历分类名称列表,对于每个分类,如果'title'列包含该分类名称,则在对应的列中将相应行的值设为1。1.先读取CSV文件,并将'timeStamp'列转换为日期时间格式,并设置为DataFrame的索引。4. 从'title'列中提取分类信息,并创建一个新的列'cate'来存储分类。2.从'title'列中提取分类信息,并创建一个新的列'cate'来存储分类。原创 2024-02-15 17:42:17 · 943 阅读 · 0 评论 -
利用pandas库进行数据分析(三)
使用matplotlib绘制折线图,x轴表示年份,y轴显示每个年份的平均书籍评分。准备数据用于绘图,年份作为x轴标签,平均评分作为y轴的值。设置了pandas显示的最大行数、列数和宽度。列中nan值的行,以便后续分组时不受影响。列进行分组,并计算每个年份下书的平均评分。读取了包含书籍数据的CSV文件。文件大小:1,000.3 K|原创 2024-02-15 10:15:23 · 417 阅读 · 0 评论 -
利用pandas读取MongoDB库中的数据
这段代码首先连接到MongoDB数据库,并从指定的集合中查询数据。然后,它遍历查询结果,提取每条记录中的特定字段,并将这些字段存储在一个字典中。这些字典被添加到一个列表中,最后将这个列表转换为一个DataFrame。接着,它设置了pandas的显示选项,以便更好地查看DataFrame。最后,它打印了DataFrame的前1行,并将'info'列的字符串按'/'分割成列表。下方代码的主要目的是从MongoDB数据库中获取数据,并使用pandas库将其转换为DataFrame。文件大小:423.7 K|原创 2024-02-13 20:58:34 · 676 阅读 · 0 评论 -
pandas库的基本用法
如果在方括号中写入一个整数或整数数组,我们将取行;如果写入一个字符串,我们将取列。最后,我们打印了前20行,在这段代码中,我们首先读取了一个CSV文件并创建了一个DataFrame。的CSV文件,并将其转换为一个pandas的DataFrame对象。列的值对DataFrame进行了降序排序。接下来,我们使用方括号。列中值大于800且小于1000的所有行,并打印这些行。列的数据类型,它是一个pandas的Series对象。下面为代码涉及到的csv文件。这段代码首先读取了一个名为。文件大小:55.3 K|原创 2024-02-13 20:41:19 · 385 阅读 · 0 评论 -
利用pandas库进行数据分析
然后,我们从DataFrame中提取了电影评分的数据。接着,我们计算了电影评分的最大值和最小值,并根据这两个值计算了直方图的组数列表。最后,我们设置了图形的大小,绘制了电影评分的分布直方图,并显示了图形。然后,我们从DataFrame中提取了电影时长的数据。接着,我们计算了电影时长的最大值和最小值,并根据这两个值计算了直方图的组数。最后,我们设置了图形的大小,绘制了电影时长的分布直方图,并显示了图形。请注意,直方图的组数是通过一个循环动态生成的,每0.5分为一组,从1.6开始,直到最大评分值。原创 2024-02-13 21:11:01 · 461 阅读 · 0 评论 -
pandas基本用法
【代码】pandas基本用法。原创 2024-02-14 11:00:52 · 1709 阅读 · 0 评论 -
利用pandas库进行数据分析(二)
按照国家分组,并统计每个国家店铺的数量# 统计中国每个省店铺的数量# 数据按照多个条件进行分组,返回Series# 数据按照多个条件进行分组,返回DataFrame# 索引的方法和属性print(grouped1.index) # 打印分组后的索引,即每个分组的键。原创 2024-02-15 09:58:25 · 572 阅读 · 0 评论