- 博客(6)
- 收藏
- 关注
转载 Python 网页爬虫 & 文本处理 & 科学计算 & 机器学习 & 数据挖掘兵器谱
曾经因为NLTK的缘故开始学习Python,之后渐渐成为我工作中的第一辅助脚本语言,虽然开发语言是C/C++,但平时的很多文本数据处理任务都交给了Python。离开腾讯创业后,第一个作品课程图谱也是选择了Python系的Flask框架,渐渐的将自己的绝大部分工作交给了Python。这些年来,接触和使用了很多Python工具包,特别是在文本处理,科学计算,机器学习和数据挖掘领域,有很多很多优秀的Py
2014-09-15 18:54:27
1000
转载 数据库、后台、服务器、mysql、和python分别是什么关系?
后台(计算机对用户业务的处理) -> 服务器(apacheWeb服务器,NginxWeb服务器等) -> python(计算机语言,像C、C++等) -> 数据库(mysql,sql server,oracle等)
2014-09-15 18:52:26
2181
转载 Simple-TODO: 一个简易的 todo 程序 - web.py 中文教程
为什么要写这个教程呢?非常多的新手问同样的问题,很烦恼。我并不打算写得大而全,我只想写一个简单的入门级的,解决新手的烦恼,其他知识你需要看官方文档。我写了一个简单的 todo 程序,供新手学习和参考。查看100%效果图 > 来看源代码的?直接拉到最后。新人的烦恼许多新手,特别是从 ASP/PHP/JSP 转过来的同学,经常问下面这几个问题:所有东西都放在一个
2014-09-15 17:57:14
1122
转载 全面解读python web 程序的9种部署方式
python有很多web 开发框架,代码写完了,部署上线是个大事,通常来说,web应用一般是三层结构web server ---->application -----> DB server主流的web server 一个巴掌就能数出来,apache,lighttpd,nginx,iisapplication,中文名叫做应用服务,就是你基于某个web framework写的应用代
2014-09-15 17:53:33
654
转载 网站采集程序编写技巧
采集是中国互联网高频操作,如果你不会编程,可以用"火车头"这样的软件,这个软件也是需要学习成本的,可能会有点复杂。程序员来做当然是自己编程,我一般用python写爬虫程序,偶尔用javascript,我以前见过一个码农用c++写,把网页clean/tidy之后强行用libxml构建document tree来解析,相当有想象力,估计是在某个搜索引擎工作。临时性采集某个页面 直接用f
2014-09-15 17:46:41
1454
转载 Python简单抓取原理引出分布式爬虫
转载请注明出处:http://blog.youkuaiyun.com/yiliumu/article/details/21335245#!/usr/bin/python#-*- coding: utf-8 -*-'''Created on 2014-03-16@author: Kris'''import urllib2, re, cookielibdef httpCrawler(ur
2014-09-15 16:10:26
779
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人