
pandas学习总结
尘归尘-北尘
机器学习爱好者,希望成为一个脚踏实地的理想主义者。
展开
-
pandas时序数据-task4
pandas时间数据学习的一点总结原创 2020-06-29 23:24:03 · 263 阅读 · 0 评论 -
Pandas分类数据-task3
pandas处理分类数据1.创建分类数据2.获取分类数据的信息3.类别的修改4.分类数据的排序1.创建分类数据分类数据指按一定区间,将数据分类,类似于数据分桶。指定列数据类型:dtype=“category”,这样新建的series就是分类类型。pd.Series(["a", "b", "c", "a"], dtype="category")0 a1 b2 c3 adtype: categoryCategories (3, object): [a, b, c]原创 2020-06-27 23:34:54 · 256 阅读 · 0 评论 -
pandas文本操作学习-task2
pandas文本操作1.常用文本操作1.1 文本替换1.2 特定字符串提取1.3 分割与拼接参考1.常用文本操作个人觉得文本操作有三种,匹配替换,匹配提取,分隔,拼接。下面依次分析。1.1 文本替换这里指将字符串某个模式的内容,替换为指定内容的过程。比如将字母替换为※号。在进行替换时,需要对python的正则表达式有一定了解。定义:正则表达式是一个特殊的字符序列,它能帮助你方便的检查一个字符串是否与某种模式匹配。Python 自1.5版本起增加了re 模块,它提供 Perl 风格的正则表达式模式原创 2020-06-26 23:02:06 · 215 阅读 · 0 评论 -
pandas缺失值处理-task01
pandas 缺失值处理1.缺失值种类1.1 令人头秃的np.nan1.2 基本见不到的None1.3 时间缺失项NaT2.新特性2.1 解决缺失值改变数据类型的问题3.缺失值插值1.缺失值种类pandas中缺失值有三种,np.nan,None,及针对时间的缺失值类型,NaT,下面分开讲解这三种类型。1.1 令人头秃的np.nan首先是np.nan,由于pandas是基于Numpy的,Numpy的缺失值类型就是pandas最常见的缺失值类。但这个np.nan有大量问题,分下面几点。np.nan什原创 2020-06-23 14:57:18 · 619 阅读 · 0 评论