
数据分析
文章平均质量分 92
数据分析,从基础到实战分享个人经验总结。
才疏学浅的莫笑天
飞鸟与鱼不同路,从此山水不相逢。
展开
-
一文过pandas入门(结篇)——才疏学浅的莫笑天
本来是准备直接上实战的,后来想了想还是先把必要的东西讲完吧,要不然到时候实战很多东西会很懵,又要递归的去讲就很麻烦。这篇文章就是pandas的最后一篇内容讲解了,三篇连到一块应该足够应对绝大多数的内容过了,实际上也把pandas的主要内容讲的差不多了,漂亮的结一个尾吧。先来口头阐述一下分组的概念分组与聚合其实分组就是字面意思呀比如如下数据:(代码导入数据)import pandas as pdfile_path = './split_test.xlsx'df = pd.read_exce原创 2021-11-25 04:15:41 · 639 阅读 · 0 评论 -
一文过pandas入门(中篇)——才疏学浅的莫笑天
本篇核心内容为数据清洗。数据清洗数据工作的步骤应该为:数据获取数据清洗数据分析数据可视化与建模因此,上一篇博文中,本人说过,下一篇博文会讲一下数据分析中重要的一步我们要知道,数据清洗本着为下一步数据分析服务的目的进行,因此,数据处理要根据数据分析确定它是否需要处理,需要怎样的处理,才能适应接下来的分析工作和挖掘工作。整体分为几个不同的步骤来看。import pandas as pdimport numpy as np一. 缺失数据的处理整体的处理方法在理论上我们可以采用填补或原创 2021-11-21 21:54:18 · 4436 阅读 · 0 评论 -
一文过pandas入门(前篇)——才疏学浅的莫笑天
前篇主要是讲明pandas到底是什么,pandas中的常用的基本数据方法,数据交互方式,需要注意的踩坑点等。之前整理了numpy部分的知识点,numpy的numpy.array对于python的数组运算做了很大贡献,使得python程序员可以用接近c语言的速度对矩阵数据进行运算吗,这对于后置的机器学习模块包括深度学习模块的贡献非常大,但对于数据分析来说,例如一个excel文件中,它并不是单独的包含一个数值类型,之前在读取csv文件的时候,显然里面包含时间序列,姓名等字符串序列,那numpy显然在很多时候并原创 2021-11-20 20:34:52 · 1683 阅读 · 0 评论 -
一万字,一文过numpy--才疏学浅的莫笑天
最近不是校招,刚好晚上睡不着,就随便整理一下numpy的东西啊,结果写嗨了。。直接写到四点,应该是把numpy讲差不多了,整体框架肯定是完整的,细节那么多,肯定不会刻意去涉及,不过核心点,大致都说了。建议小白读者跟着一块敲。如果下载anconda,会自带numpy,如果没有的话,就直接pip install numpy -i http://pypi.douban.com/simple --trusted-host pypi.douban.comnumpy类似于list,但与list对象有区别li原创 2021-11-17 05:27:57 · 558 阅读 · 0 评论