方舟aark
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
Python:学习爬取数据以分析(城市、注册时间、发表时间、评分、评论内容)
最近因为泰迪实习需要,做一些这样的数据分析。分享一下相关代码。修改其中的url(注意应用规则,需要对爬虫有一定了解)即可用。import requestsimport refrom task_getUserInf import getUserInfimport pandas as pdimport emoji#用户数据获取res = []count = 1;number = -1for i in range(0,20): print("========正在爬取第{}页用户数原创 2021-07-26 17:08:19 · 1294 阅读 · 4 评论 -
Python:使用正则表达式爬虫如何处理HTML代码中的换行?
比如我们需要爬豆瓣二十条短评,使用正则表达式:<span class=“short”>(.*?)</span>我们只能爬到17个,为什么呢?因为有的短评是带有换行的,正则表达式无法识别。如何让它识别呢?将(.*?)换为((?:.|\n)*?)就可以了!<span class=“short”>((?:.|\n)*?)</span>......原创 2021-07-26 15:23:29 · 1792 阅读 · 0 评论 -
Python:使用灰色预测对数据进行预测
灰色预测代码# condig:utf-8import torch as thimport numpy as npclass GM(): def __init__(self): # 判断是否可用 gpu 编程 , 大量级计算使用GPU self._is_gpu = False # th.cuda.is_available() def fit(self,dt:list or np.ndarray): self._df :th.Te原创 2021-07-24 14:07:42 · 4265 阅读 · 1 评论 -
Python:(人工智能识别手写数字)使用卷积神经网络代码多个报错及相应解决方法
整个卷积神经网络代码(入门:识别手写数字)如下:import torchimport torch.nn as nnfrom torch.autograd import Variableimport torch.utils.data as Dataimport torchvisionimport matplotlib.pyplot as pltEPOCH = 1BATCH_SIZE = 50LR = 0.001DOWNLOAD_MNIST = Falsetrain_data = t.原创 2021-07-23 23:38:59 · 2005 阅读 · 4 评论 -
Python:mac下解决绘图时中文乱码问题
只需要在代码plt.show前面加入plt.rcParams['font.sans-serif'] = ['Arial Unicode MS']即可解决问题:原创 2021-07-20 21:10:07 · 803 阅读 · 2 评论 -
Python:如何将csv文件某一列中所有相同元素的行分别另外以要求的命名格式保存
假设我们需要根据设备ID重新提取对应的数据,保存在csv文件中,文件名分别为"task1-1A.csv",“task1-1B.csv”,“task1-1C.csv”…代码如下:import pandas as pdimport numpy as npdata = pd.read_csv("../data/data1.csv",encoding="gbk")data = np.array(data)# print(data)total = []i = 0for col in data:.原创 2021-07-19 19:12:34 · 3374 阅读 · 5 评论 -
Python:在csv如何提取出某一月份的数据
(支付时间是正常的,excel问题)eg:如何提取出5月份的数据?我们利用data = pd.read_csv("../data/task1-1A.csv",encoding="gbk")time = data['支付时间']print(time)可以得到:使用以下代码即可解决:import pandas as pddata = pd.read_csv("../data/task1-1A.csv",encoding="gbk")time = data['支付时间']data['.原创 2021-07-19 19:47:03 · 3262 阅读 · 0 评论 -
Python:在csv表中自动获得销量前五的商品信息
使用代码:import matplotlib.pyplot as pltimport pandas as pddata = pd.read_csv('../data/data1.csv',encoding='gbk')# print(data['商品'])total = []res = []result = []maxFiveNum = []num = 0def count(i): k = 0 for i1 in data['商品']: if(i =.原创 2021-07-20 20:46:51 · 1596 阅读 · 0 评论