- 博客(5)
- 收藏
- 关注
原创 利用机器学习解决问题的一般流程之0-4数据导入和数据分析
1、定义问题,获取数据2、导入数据3、分析数据(以pandas DataFrame类型数据为例)1、打印数据,简单查看print(data.head())2、数据维度3、数据属性和类型:4、描述性统计:通过DataFrame 的describe()方法来查看描述性统计的内容。这个方法给我们展示了八方面的信息:数据记录数、平均值、标准方差、最小值、下四分位数、中位数、上四分位数、最大...
2019-11-19 21:43:13
505
原创 pandas数组中:将文本、float、int类型的日期数据转换为pandas日期数据
In [51]: pd.to_datetime('2010/11/12', format='%Y/%m/%d')Out[51]: Timestamp('2010-11-12 00:00:00')In [52]: pd.to_datetime('12-11-2010 00:00', format='%d-%m-%Y %H:%M')Out[52]: Timestamp('2010-11-12 ...
2019-11-18 15:06:36
2409
原创 将pandas Timestamp数据转换成unix纪元,并将Index类型转化为numpy数组类型的方法
把时间戳转换为纪元反转上述操作,把Timestamp转换为unix纪元:In [64]: stamps = pd.date_range('2012-10-08 18:15:05', periods=4, freq='D')In [65]: stampsOut[65]: DatetimeIndex(['2012-10-08 18:15:05', '2012-10-09 18...
2019-11-11 11:40:25
300
原创 为什么每个箱子的斜率都是相同的?
import numpy as npimport matplotlib.pyplot as pltimport mglearnfrom sklearn.preprocessing import OneHotEncoderfrom sklearn.linear_model import LinearRegressionfrom sklearn.tree import DecisionTre...
2019-11-10 11:33:04
214
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅