
Python应用
文章平均质量分 74
Uri栗子
这个作者很懒,什么都没留下…
展开
-
三个月零基础自学python编程の教程 / 书籍 / 网站分享
作为一个编程小白,断断续续自学python将近半年,刚开始学python是因为感兴趣,每次看到计算机专业的同学写代码做软件都让我十分羡慕,第二个原因是python可以提高生产力,比如统计词频、批量解压压缩包等等,几行代码就可以解放双手,最重要的原因是编程就像数学一样,不仅可以解决问题,还能够锻炼大脑,让人用不同的思维去思考问题,比如解决同样一个问题,编程和数学是两种解题思路,单python这门编程语言就有无数种解题方法。这篇文章主要分为三个部分:自学书籍、编程交流网站、python在学习和工作中的应用,可原创 2021-03-17 13:56:14 · 410 阅读 · 0 评论 -
Python| LSTM长短期记忆网络多元时间序列预测
本文使用的数据为标普500指数的开盘价、收盘价、高点、低点、收益率以及从社交媒体twitter中提取的社交媒体情绪指数。from math import sqrtfrom numpy import concatenatefrom matplotlib import pyplotimport pandasfrom pandas import read_excelfrom pandas import DataFramefrom pandas import concatfrom sklearn.p原创 2020-05-16 16:44:55 · 1419 阅读 · 2 评论 -
python多元线性回归预测时间序列
本文使用的数据为Z-score标准化后的数据,如何使用进行z-score标准化参照python一行搞定z-score标准化。通过训练集拟合多个变量,并使用测试集评估预测效果。本文除了绘制预测值和实际值的对比曲线之外,计算均方根误差评估准确程度。import pandas as pdimport matplotlib.pyplot as pltimport matplotlib as mplfrom sklearn.model_selection import train_test_split #原创 2020-05-16 16:26:45 · 4638 阅读 · 0 评论 -
python一行搞定Z-score标准化
使用sklearn的scaler方法进行z-score标准化处理只需要一行:from sklearn import preprocessingdata = preprocessing.scale(values) #注意,这里的values是array对pandas dataframe进行最大最小值标准化处理再加两步:将dataframe转化为array,以及将array还原为dataframe.import pandasfrom pandas import read_excelfrom sk原创 2020-05-16 16:18:53 · 25778 阅读 · 4 评论 -
多层多路径子文件夹批量解压压缩包到指定目录(以B2Z格式压缩包为例)
下载了个层级特别多的压缩包,命名为Apr,Apr下面有30个文件夹,代表30天,每个文件夹下有24个文件夹,代表24个小时,每个小时文件夹下有60个压缩包,代表60分钟,累计43200个压缩包,人工解压太费时间,因此写了个代码批量解压。文件路径有多层,Apr/01/01/00.json.b2z代表4月1日01点00分的数据。我把所有解压的文件都另存到新的文件夹,如Apr/01/01所有子文件夹下的压缩包(从Apr/01/01/00.json.b2z到Apr/01/01/59.json.b2z)都解压到Ap原创 2020-05-16 15:59:44 · 2329 阅读 · 0 评论 -
python两行搞定最大最小值标准化(0-1标准化)
使用sklearn的MinMaxScaler方法进行最大最小值标准化处理只需要两行:from sklearn.preprocessing import MinMaxScalertool = MinMaxScaler(feature_range=(0, 1)) #根据需要设置最大最小值,这里设置最大值为1.最小值为0data = scaler.fit_transform(values) #标准化,注意这里的values是array对pandas dataframe进行最大最小值标准化处理再加两原创 2020-05-16 15:24:14 · 9838 阅读 · 0 评论 -
使用Python快速统计关键词及其词频
思路:1.通过jieba库分词获取所有的词语列表;2.计算列表里出现词语及其对应的频次,存储为字典;3.删除字典中键为无关且频次高的词语的键值对;4.对字典里的词语按照频次进行排序;5.输出频次前五的词语及其频次;如果没有安装 jieba 库,需要使用 cmd 进入命令提示符窗口,通过 pip install jieba 进行安装。源代码如下import jiebafile...原创 2019-01-31 09:32:43 · 18845 阅读 · 5 评论 -
python第三方库wordcloud绘制任意形状词云教程
若原文本为汉字,则需要指定WordCloud方法中的font_path,且指定的字体文件需要放在wordcloud安装的文件夹下,我电脑中的路径为D:\Program Files\Python37\Lib\site-packages\wordcloud\simhei.TTF否则生成的词云图片上会是彩色方框,而不会出现汉字。mask为遮罩若遮罩图片为png格式,则使用scipy库:fr...原创 2019-01-31 09:57:14 · 9280 阅读 · 1 评论