
数据分析
文章平均质量分 92
3coco
现在搞AGI
展开
-
matplotlib基础学习笔记(2)
线型图:设置全局图像大小,颜色以及线条。plt.rc('figure',figsize=(16,8)) df0 = df[['date','open','low','volume']]df0.index = df0['date']df0.plot(figsize=(14,4))#内置参数改变图像大小柱状图:Series 的柱状图:fig,axes = plt.subplots...原创 2019-03-13 22:11:05 · 372 阅读 · 0 评论 -
k-近邻算法
**k-近邻算法(kNN)**的工作原理:存在一个样本数据集合,也称作训练样本集,并且样本集中每个数据都存在标签,即我们知道样本集中每一数据与所属分类的对应关系。输入没有标签的新数据后,将新数据的每个特征与样本集中数据对应的特征进行比较,然后算法提取样本集中特征最相似数据(最近邻)的分类标签。一般来说,只选择样本集中前 k 个最相似的数据,通常 k 是不大于20的正式。**k-近邻算法(kN...原创 2019-03-18 21:01:38 · 348 阅读 · 0 评论 -
上证50股票分析
根据股票基本面价值投资分析要点和常用财务指标计算公式对上证50作简略分析。一、选股角度1、市盈率能够显示成长性,目标股的市盈率的倍数至少应等于未来三年复合增长的百分比数,而市盈率的倍数应低于20倍。2、算清未来三年的帐,未来三年上市公司复合增长率最低应大于18%,越大越好。3、毛利率应至少大于20%,而且最近三年应呈现稳定趋升的态势,不能下降。4、公司年利润总数绝对值越大越好,说明公司实...原创 2021-12-31 12:00:10 · 767 阅读 · 0 评论 -
matplotlib基础学习笔记(1)
import matplotlib.pyplot as pltimport numpy as np%matplotlib inline # juyter调用matplotlib.pyplot画图所需关于[%matplotlib详情]。(https://www.jianshu.com/p/2dda5bb8ce7d)本笔记所用图片都是通过plt.savefig()函数保存。用plt.f...原创 2019-03-10 16:49:16 · 512 阅读 · 0 评论 -
pandas 中读取和写入csv文件时候出现Unnamed,解决方案
在读取csv文件的时候,默认会自动添加新的一列,Unnamed。解决方案:read_csv()时候,设置index_col=0即可。在写入csv文件的时候,默认会自动加入新的一列,Unnamed,解决方案:to_csv()时候,设置index=False。或者加上index=True, index_label=“id”作者:数据轨迹来源:优快云原文:https://blog.csdn...转载 2019-03-04 12:01:42 · 2964 阅读 · 0 评论 -
plot参数详解
封装matplotlib的plot函数pandas.plotDataFrame.plot(x=None, y=None, kind=‘line’, ax=None, subplots=False, sharex=None, sharey=False, layout=None, figsize=None, use_index=True, tit...转载 2019-03-09 15:36:23 · 6797 阅读 · 0 评论 -
pandas切片,loc和iloc
在DataFrame中的直接选取,如df[0:3],是从第0行到第2行,左闭右开。df.loc[0:3]选取第0行到第3行。df.iloc[0:3]和df[0:3]一样。loc 和 iloc 的区别:loc是根据索引来进行选取,iloc是根据位置进行索引。...原创 2019-03-09 15:08:03 · 823 阅读 · 0 评论 -
You are trying to merge on object and datetime64[ns] columns.
用padas分别读取了csv文件和xlsx文件,根据有相同的date列,用 .merge 方法合并。df=house_price_index.merge(shiller,on='date')\ .merge(unemployment,on='date')\ .merge(federal_funds_rate,on='date') .merge(gross_domestic_pr...原创 2019-03-04 11:37:05 · 10698 阅读 · 1 评论 -
Kettl基于Sakila数据库的客户兴趣邮件推送
基于Mysql的样本数据库Sakila,获取顾客消费记录和顾客信息写入数据库,并从消费记录中分析出顾客感兴趣的产品表单,定期从表单中选出产品进行Email推送。项目总览建立第一个转换“客户消费记录”“客户消费记录”转换主要目的是获取客户的个人信息,消费信息以及产品信息合并写入表customer_consumption(客户消费)表中,主要分为三次“表连接”。转换中读取了inventory...原创 2019-04-23 21:16:28 · 814 阅读 · 0 评论