
数据分析
金帛文武在南京
这个作者很懒,什么都没留下…
展开
-
python读取txt文件最后一行(文件大+文件小)
txt文件小#coding:utf-8'''fname为所读xx.txt文件输出为:文件第一行和最后一行'''fname = 'test.txt'with open(fname, 'r') as f: #打开文件 lines = f.readlines() #读取所有行 first_line = lines[0] #取第一行 last_line = lines[-原创 2016-04-05 20:33:36 · 27870 阅读 · 3 评论 -
数据清洗经验
数据为什么需要清洗字段缺失前后结构不一致数据取值范围不对不是易于分析的格式清洗数据技巧使用断言 Assertions 例如每条记录有4个字段,断言之; 某个字段是整数,断言之。反正,能断言的都断言,不要嫌麻烦。对于不完整或者损坏的记录,不要默默跳过 可以打印出提示信息,方便之后查找 记录跳过记录的条数,和总记录数,看看比例如果有枚举字段,且种类多,可以不用断言,遇到新种类时打印原创 2017-03-02 20:57:29 · 889 阅读 · 0 评论