Python
文章平均质量分 82
xukaics
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
使用Python Pandas处理亿级数据
转载自:http://www.justinablog.com/archives/1357在数据分析领域,最热门的莫过于Python和R语言,此前有一篇文章《别老扯什么Hadoop了,你的数据根本不够大》指出:只有在超过5TB数据量的规模下,Hadoop才是一个合理的技术选择。这次拿到近亿条日志数据,千万级数据已经是关系型数据库的查询分析瓶颈,之前使用过Hadoop对大量文本进行分类转载 2016-01-17 15:36:55 · 2655 阅读 · 0 评论 -
Python字符编码详解
转载自:点击打开链接 http://www.cnblogs.com/huxi/archive/2010/12/05/1897271.html1. 字符编码简介1.1. ASCIIASCII(American Standard Code for Information Interchange),是一种单字节的编码。计算机世界里一开始只有英文,而单字节可以表示256个不同的转载 2016-01-25 10:38:23 · 649 阅读 · 0 评论 -
urllib2请求csdn时,显示: urllib2.HTTPError: HTTP Error 403: Forbidden
转载自:原文章 https://www.douban.com/note/131370224/出现urllib2.HTTPError: HTTP Error 403: Forbidden错误是由于网站禁止爬虫,可以在请求加上头信息,伪装成浏览器访问#伪装浏览器头headers = {'User-Agent':'Mozilla/5.0 (Windows; U; Window转载 2016-01-25 16:15:11 · 773 阅读 · 0 评论
分享