
处理数据
文章平均质量分 73
赵清河
这个作者很懒,什么都没留下…
展开
-
统计文本中出现的数量最高的前5个单词
def read_file():with open(‘C:/Users/84785/PycharmProjects/pythonProject/3.txt’, ‘r’, encoding=‘utf-8’) as f:word = [] # 空列表用来存储文本中的单词# readlins为分行读取文本,且返回的是一个列表,每行的数据作为列表中的一个元素:for word_str in f.readlines():# 去除原文中的逗号 双引号word_str = word_str.replace(原创 2022-02-09 11:34:04 · 1700 阅读 · 0 评论 -
numpy以及pandas的具体使用
numpy方法的使用 numpy方法:快速,方便,科学计算的基础库,重在数值计算,多用于大型,多维数组上执行数值运算import numpy as npnp.arange方法np.array(range(10)) = np.arange(10)a=np.arange(24) #创建数组array([ 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16,17, 18, 19, 20, 21, 22, 23]) a原创 2020-07-04 17:49:15 · 489 阅读 · 0 评论 -
使用pandas处理数据
使用pandas处理大型数据方法来统计数据下图为使用爬虫爬取豆瓣美国英国中国的电视剧信息要求获得每一个国家的电视剧数量,因此需要数据分析,使用pandas方法进行处理,思路为构造一个全为0的数组,然后循环遍历,将属于每一个类别的电影设为1import pandas as pddf = pd.read_csv(.//douban.csv) #pandas方法读取csv文件也可是txt或别的temp_list = df[“country”].tolist() # 每个电影的国家列表countr原创 2020-07-03 18:20:46 · 387 阅读 · 1 评论