
【抓取】
sunshine0625
只要每天不在原地,就好
展开
-
爬虫抓取
爬虫抓取的方式有两种:1.简单import urllib2dir(urllib2)urllib2.urlopen(url)html=responce.read()2.复杂import urllib2def make_opener(headers=None): cookie=cookielib.CookieJar() opener=原创 2016-07-26 20:04:39 · 382 阅读 · 0 评论 -
git入门
1.初始化版本:git initgit remote add origin http://gitlab.baidu.com/i18n_crawl.git2.添加密钥:cd ~/.sshlsssh-keygencat .pub3.git设置邮箱和密钥: git config --global user.name "yang" gi原创 2016-07-27 19:54:18 · 256 阅读 · 0 评论 -
awk基本操作
$0变量:它指的是整条记录。如$ awk '{print $0}' test将输出test文件中的所有记录。变量NR:一个计数器,每处理完一条记录, NR的值就增加1。如$ awk '{print NR,$0}' test将输出test文件中所有记录,并在记录前显示记录号。eg:awk '{print NR,$0}' abcawk中的数组的下标可以是数字和字母,原创 2016-07-28 18:23:46 · 413 阅读 · 0 评论