
python
tianjinsong
0101101001001
展开
-
Python的MySQLdb模块安装
http://www.cnblogs.com/rollenholt/archive/2012/05/07/2487137.html系统:ubuntu 11.10mysql:直接apt-get安装的,version:5.1.62 到官方下载MySQL for Python然后解压,打开README:里面有安装过程: tarxfzMyS转载 2017-03-22 17:14:21 · 2898 阅读 · 0 评论 -
使用pandas进行SEO日志分析
http://www.jianshu.com/p/84d4f9c6e83f虽然网络上有比较多的SEO日志分析工具,比如爱站,光年,但那都是固定维度的,不如自己写的灵活,想怎么拆分就怎么拆分,加上最近在学习《利用python进行数据分析》这本书,正好可以用来练习练习,顺便熟悉一下pandas库。不得不说,pandas这个库真的强大的不要不要的,对数据的加载、存储、清理、转换、合并转载 2017-08-12 15:43:49 · 3168 阅读 · 0 评论 -
使用Python Pandas处理亿级数据
http://www.cnblogs.com/frchen/p/5749814.html在数据分析领域,最热门的莫过于Python和R语言,此前有一篇文章《别老扯什么Hadoop了,你的数据根本不够大》指出:只有在超过5TB数据量的规模下,Hadoop才是一个合理的技术选择。这次拿到近亿条日志数据,千万级数据已经是关系型数据库的查询分析瓶颈,之前使用过Hadoop对大量文本进行分类转载 2017-08-12 15:52:18 · 4339 阅读 · 0 评论 -
别老扯什么Hadoop了,你的数据根本不够大
http://geek.youkuaiyun.com/news/detail/2780本文原名“Don't use Hadoop when your data isn't that big ”,出自有着多年从业经验的数据科学家Chris Stucchio,纽约大学柯朗研究所博士后,搞过高频交易平台,当过创业公司的CTO,更习惯称自己为统计学者。对了,他现在自己创业,提供数据分析、推荐优化咨询服转载 2017-08-12 17:43:54 · 2718 阅读 · 0 评论