- 博客(124)
- 收藏
- 关注
原创 时间序列数据分析
1.滑动窗口指的是根据指定的单位长度来框住时间序列,从而计算框内的统计指标。相当于一个长度指定的滑块在刻度尺上面滑动,每滑动一个单位即可反馈滑块内的数据。2.滑动窗口的概念比较抽象,下面我们来举个例子描述一下。某分店按天统计了2017年全年的销售数据,现在总经理想抽查分店8月28日(七夕)的销售情况,如果只是单独拎出来当天的数据,则这个数据比较绝对,无法很好地反映出这个日期前后销售的整体情况。为了提升数据的准确性,可以将某个点的取值扩大到包含这个点的一段区间,用区间内的数据进行判断。
2024-05-25 23:42:51
2177
原创 excel文件
库本身比较复杂,很多功能未必用得上,日常使用可以简单的封装,能够。同样可以,并且筛选代码保存后,下次可以。详细的使用说明,可以参见pandas。上述操作,都假设字段类型是。
2024-05-25 23:41:55
400
原创 csv文件
CSV文件是一种纯文本文件,以逗号分隔数值的文件类型,可以使用任何文本编辑器进行编辑,它支持追加模式,节省内存开销。在数据库或电子表格中,常见的导入导出文件格式就是CSV格式。
2024-05-25 23:41:26
559
原创 Pandas基本操作
而right表中的数据是完整的,并且right表与left表有相同的索引名,此时我们可以使用right表中的数据来填充left表的缺失数据,得到一个新的result表。,右连接是以右表为基准,右表中的数据全部显示,而左表中显示与重叠数据行索引值相同的数据,合并后缺失的数据使用NaN填充合并。例如,通过爬虫采集到的数据都是整型的数据,在使用数据时希望保留两位小数点,这时就需要将数据的类型转换成浮点型。创建Pandas数据对象时,如果没有明确地指出数据的类型,则可以根据传入的数据推断出来,并且通过。
2024-05-25 23:38:59
898
原创 Pandas数据结构
主要是因为在实际使用中,列索引的名称中很有可能带有一些。地操作Series对象中的索引和数据,所以该对象提供了两个属性。除了使用列表构建Series类对象外,还可以使用。当某个索引对应的数据进行运算以后,其运算的结果会。Series的索引位于左边,数据位于右边。在创建DataFrame类对象时,如果为其。,返回的结果是一个Series对象。,返回的结果是一个Series对象。,仍然与这个索引保持着对应的关系。,则DataFrame的列会按照。DataFrame的索引不仅有。
2024-05-22 15:09:46
550
原创 pandas概述
什么是数据分析呢?数据分析是使用适当的统计分析方法对收集来的大量数据进行分析,从中提取有用信息和形成结论,并加以详细研究和概括总结的过程。将隐藏在一大批看似杂乱无章的数据信息集中提炼出来有用的数据,以找出所研究对象的内在规律。在统计学领域中,数据分析可以划分为如下三类类目描述描述性数据分析从一组数据中,可以摘要并且描述这份数据的集中和离散情形。探索性数据分析从海量数据中找出规律,并产生分析模型和研究假设。验证性数据分析验证科研假设测试所需的条件是否达到,以保证验证性分析的可靠性。
2024-05-22 15:09:10
1719
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人