
可视化
文章平均质量分 85
泛泛之素
君子不器
展开
-
Ubuntu16.04 将 Flaskapp 部署到Heroku 上
这回要把flask项目部署到 Heroku网站上,由于这样就没有办法用mysql数据库,要实现项目的功能我们要重新更改获取数据方式: 这里我们把策略改为:网页搜索 –> form获取股票代码 –> 爬虫爬取数据 –> 数据传输到网页 –> js可视化处理 这里写一个获取数据的脚本,全是以前写过的代码拼凑的,就不标注了import requestsfrom bs4 ...原创 2018-09-15 09:44:20 · 2882 阅读 · 7 评论 -
python数据可视化: 使用 pandas
数据链接以下是本数据集的13个特征变量的详细说明:order_id:订单ID,数字组合而成,例如4283851335。order_date:订单日期,格式为YYYY-MM-DD,例如2013-10-17。order_time:订单日期,格式为HH:MM:SS,例如12:54:44。cat:商品一级类别,字符串型,包含中文、英文。attribution:商品所属的渠道来源,字符串型,...原创 2018-12-26 16:18:58 · 3045 阅读 · 0 评论 -
python数据可视化: 使用matplotlib
matplotlib 使用2D图属性:import pandas as pdimport matplotlib.pyplot as pltimport numpy as npimport warningswarnings.filterwarnings('ignore')# 设置风格plt.style.use('ggplot')%matplotlib inline散点图x ...原创 2018-12-28 08:59:36 · 2423 阅读 · 0 评论 -
python数据可视化: 使用seaborn(上)
数据数据集是kaggle上关于steam游戏的数据,链接在此数据解释:name: 游戏名称average_2weeks: 最近两周不知啥的平均值数据集上也没有写average_foreve: 同上owners: 多少人把游戏加入游戏库players_foreve: 多少人玩过游戏negative: 不喜欢人数positive: 喜欢人数price: 价格(美分)publis...原创 2018-12-28 15:25:34 · 3226 阅读 · 0 评论 -
python数据可视化: 使用seaborn(下)
数据详细请见上一篇.数据载入:import pandas as pdimport numpy as npfrom matplotlib import pyplot as plt, cmimport seaborn as snsfrom sqlalchemy import create_engineimport sqlite3import warnings%matplotlib...原创 2018-12-29 12:43:12 · 3551 阅读 · 0 评论 -
python数据可视化:使用Bokeh(下)——数据交互可视化
数据回调数据回调主要包含连个部分:关键数据标签的update根据新标签数据进行新展示数据的提取一个例子:创建文件insurance_graph.py,内容如下:import numpy as npimport pandas as pdfrom bokeh.layouts import layout, widgetbox, rowfrom bokeh.palettes imp...原创 2019-01-03 20:26:02 · 6363 阅读 · 1 评论 -
python数据可视化:使用Dash进行交互式可视化
Dash上一篇介绍的是Bokeh,是一个交互式的可视化工具,Dash同样也是一个优秀的交互式可视化工具,基于plotly,个人感觉Dash比Bokeh更好用,下面是我用Dash写的一个分析报告:链接在这,感兴趣可以看一下,就是加载需要点时间:https://dash-da-hr.herokuapp.com/整体:细节:图一:图二:小例子:代码如下:import pandas...原创 2019-01-04 15:32:36 · 27252 阅读 · 20 评论 -
python数据可视化: 使用plotly
plotly是一款强大的作图工具,可以快速制作各种精美的图表,而且生成的图表可以实时与用户产生交互.数据链接在这里2012-2017年,27个美国和3个加拿大城市以及6个以色列城市的每小时天气数据,包括温度、湿度、气压、风向、风速、天气情况数据plotly作图先导入库:import pandas as pdimport numpy as npfrom plotly.offline ...原创 2018-12-30 18:56:03 · 5721 阅读 · 0 评论 -
R数据可视化:基于ggplot2&highcharter在jupyter notebook上同时使用python和R做可视化
R语言作为数据科学家专用语言,再数据可视化方面有较为突出的库,本篇简单介绍两个:ggplot2highcharter准备工作而且本编同时使用python和R做可视化,准备如下:conda install -c r r-essentials安装R内核(过程中会安装ggplot2)pip install rpy2安装rpy2conda install -c r r-highchar...原创 2019-01-05 13:41:12 · 3796 阅读 · 0 评论 -
python数据可视化:使用Bokeh(上)
数据一份关于保险的数据:链接在此。数据描述age:年龄sex:性别bmi:体重指数(BMI)是基于身高和体重的体脂指标children:孩子个数smoker:是否吸烟region:区位charges:收费预处理import numpy as npimport pandas as pdfrom bokeh.io import output_file, show, out...原创 2019-01-02 10:46:23 · 10937 阅读 · 1 评论 -
python数据可视化:使用dash给博客制作一个dashboard
dashboard仪表板通常提供与特定目标或业务流程相关的关键绩效指标(KPI)的概览。另一方面,“仪表板”具有“进度报告”或“报告”的另一个名称。“仪表板”通常显示在网页上,该网页链接到允许报告不断更新的数据库。例如,制造仪表板可以显示与生产率相关的数字,例如制造的零件数量,或每小时失败的质量检查的数量。同样,人力资源仪表板可能会显示与员工招聘,保留和组成相关的数字,例如,或平均天数或每次...原创 2019-03-07 09:55:02 · 21264 阅读 · 22 评论 -
使用Flask & Plotly 做股票k线图交互式可视化处理(三)
要想做到可交互、多图集成显示,dash是一个不错的选择,但是我这回不用dash,我这回用plotly的js,不过我么有js不是很溜,也是慢慢摸索。。主要策略就是,在网页通过js做可视化,search获得代码,mysql中查找处理后,通过jinja传递给js网页中添加js可视化部分在main.html body底部添加js部分,具体应用看这里https://plot.ly/javascr...原创 2018-09-13 18:44:45 · 5966 阅读 · 6 评论 -
使用Flask & Plotly 做股票k线图交互式可视化处理(二)
接上一篇,这篇要实现搜索功能:创建搜索页面:在templates文件夹内新建main.html文件,内容如下:<!doctype html><html lang="en"> <head> <meta charset="utf-8"> <meta name="viewport" conte原创 2018-09-13 11:31:49 · 5691 阅读 · 0 评论 -
ML: 使用 VotingClassifier 对股票预测
该项目的预测策略源于油管大神sentdex,对于其策略的正确性、适用性,不做评价。股票数据处理我们前两篇已经获取到数据了,而且也有介绍csv存入mysql,这里我们就使用已经获取的数据,有一我实验环境存储空间比较小,因此这里随机选取50只股票来进行测试:随机选取将100(其实少于100)只股票存入mysql,代码如下:import pandas as pdimport rand...原创 2018-09-10 22:10:03 · 5181 阅读 · 0 评论 -
小项目-数据处理篇:租房信息整理,plotly实现数据可视化
租房信息可视化处理原创 2018-01-02 15:04:14 · 4746 阅读 · 4 评论 -
pytorch + visdom 应用神经网络、CNN 处理手写字体分类
运行环境 系统:win10 cpu:i7-6700HQ gpu:gtx965m python : 3.6 pytorch :0.3普通神经网络class Nueralnetwork(nn.Module): def __init__(self,in_dim,hidden1,hidden2,out_dim): super(Nue原创 2018-01-12 14:50:05 · 6851 阅读 · 2 评论 -
小项目-数据处理篇:真·租房信息整理,应用dash整合到地图上
接上一章内容: 经过了一下午的爬取,也算是终于搞到一份还算像样的数据: 经过去重还有8w3,可以玩耍了,重复原因有可能是因为,很多房源本身就发了很多回,就这8w3的数据应该也有重复,我们把title删除,再drop_duplicates一下: 还有7w多,这样的数据就比较真实了,数据到手,搞起:df["rent"] = df["rent"].apply(lambda x: x原创 2018-01-04 09:07:58 · 3614 阅读 · 9 评论 -
scikit-learn K-means聚类分析算法
聚类算法,不同于分类,分类属于有监督学习,聚类属于无监督学习,聚类的作用就是将有共同属性的数据会会汇聚到一起,成为一类,我们要做的是对这一类的数据进行分析。这就好像自编码过程把图像特征压缩到几个维度的向量是一样的道理,目的是通过做以区分的特性。 k-means应用神经算法中的梯度下降,先确定k个类,确定k个中心点,计算数据到每一个中心点距离,被分到距离最近的中心点的类,对于每个类再重新计算到每个原创 2018-01-23 11:52:16 · 3833 阅读 · 0 评论 -
scikit-learn、plotly、visdom DBSCAN聚类算法、可视化处理
什么是DBSCANDBSCAN(Density-Based Spatial Clustering of Applications with Noise) 不同于k-means ,DBSCAN是一种密度聚类算法。 DBSCAN不需要指定分类的个数(k),而是指定区域密度(区域范围:半径ε;范围被判为分类的最低数据个数:MinPts),通过访问数据集中的数据,确定其是否为核心对象(以该点为中心半原创 2018-01-23 15:54:33 · 5528 阅读 · 0 评论 -
scikit-learn k-近邻分类算法(kNN)
kNN 的作用机制为 在目标周围选取最近k个点,这k个点哪种占比最大,就可以把这个目标分类到那个分类,即有分到相似属性多的类别。 该算法和回归,决策树不同之处是,回归和决策树是通过训练集确定参数,参数一旦确定直接就能拿来进行测试,而kNN不同,它的分类要凭借训练数据,或者说并没有训练这一过程。数据应用sklearn的莺尾花数据集# 加载数据iris = load_iris(原创 2018-01-22 18:51:16 · 3082 阅读 · 2 评论 -
colormap for plotly(dash,vidom)
colormaps = ['Viridis',"RdBu",'Greys','YIGnBu','Greens','YIOrRd','Bluered','Picnic','Portland','Jet','Hot','Blackbody','Earth','Electric']RdBu, Picnic,Greys,PortlandViridis,YIOrRd,Bluered,Blac原创 2018-01-16 10:59:20 · 3158 阅读 · 0 评论 -
pytorch + visdom CNN处理自建图片数据集
环境 系统:win10 cpu:i7-6700HQ gpu:gtx965m python : 3.6 pytorch :0.3数据下载来源自Sasank Chilamkurthy 的教程; 数据:下载链接。 下载后解压放到项目根目录: 数据集为用来分类 蚂蚁和蜜蜂。有大约120个训练图像,每个类有75个验证图像。数据导入可原创 2018-01-16 17:09:12 · 7323 阅读 · 24 评论 -
pytorch + visdom 处理cifar10图像分类
运行环境 系统:win10 cpu:i7-6700HQ gpu:gtx965m python : 3.6 pytorch :0.3数据集使用Cifar-10 由60000张32*32的 RGB 彩色图片构成,共10个分类。50000张训练,10000张测试(交叉验证)。这个数据集最大的特点在于将识别迁移到了普适物体,而且应用于多分类。数据下原创 2018-01-16 11:51:31 · 5773 阅读 · 4 评论 -
pytorch + visdom AutoEncode 和 VAE(Variational Autoencoder) 处理 手写数字数据集(MNIST)
环境 系统:win10 cpu:i7-6700HQ gpu:gtx965m python : 3.6 pytorch :0.3数据使用 mnist,使用方法前面文章有。train_dataset = datasets.MNIST('./mnist', True, transforms.ToTensor(), download=False)原创 2018-01-17 21:00:30 · 6337 阅读 · 0 评论 -
pytorch + visdom GAN 处理 MNIST
环境 系统:win10 cpu:i7-6700HQ gpu:gtx965m python : 3.6 pytorch :0.3什么是GAN..网上找的解答:以竞争的方式达到以假乱真的,颇有遗传算法适者生存的意味(自己瞎琢磨的)。GAN的分为两个部:第一部分为判别器,判别器只判断真伪,即 0(真)、1(假)。运作过程为两步走:1、向原原创 2018-01-18 20:56:24 · 3587 阅读 · 0 评论 -
使用Flask & Plotly 做股票k线图交互式可视化处理(一)
这里想结合mysql 、flask、plotly做一个在网页上展示的股票k线图,而且具有查找的更能,键入股票代码出现该股票的K线图。使用Plotly 画股票k线图plotly有集成的k线图方法,使用起来很方便: 这里随机选取一只股票使用plotly离线方法画图并保存在本地from sqlalchemy import create_enginefrom sqlalchemy.ext....原创 2018-09-12 20:43:15 · 10212 阅读 · 5 评论 -
小项目-数据可视化:应用dash将工作信息呈现在地图上
应用dash将工作信息呈现在地图上原创 2018-01-02 09:54:29 · 6820 阅读 · 7 评论