
git与爬虫
杨恺俞
这个作者很懒,什么都没留下…
展开
-
git版本控制及代码托管
话不多说,上干货。git直接下载,代码托管我们用github。 git命令 git init # 初始化 git status # 查看当前文件夹的状态 git add . # 对指定文件进行版本控制 git commit -m '描述版本信息(详细)' # 创建提交记录 git log # 查看 git reflog # 所有 git reset --hard 提交记录(版...原创 2019-02-01 16:22:58 · 253 阅读 · 0 评论 -
Python pyquery的基本使用
pyquery的使用与BeautifulSoup类似,只是在其基础之上加入了jQuery的方法,具体使用流程参考jQuery的官方文档与之前的BeautifulSoup函数。 官网地址:http://pyquery.readthedocs.io/en/latest/ jQuery参考文档: http://jquery.cuishifeng.cn/ from pyquery import PyQue...原创 2019-02-10 21:21:59 · 213 阅读 · 0 评论 -
python BeautifulSoup4实战常用操作
首先看下面几行代码: import requests from bs4 import BeautifulSoup as bs content = requests.get('https://book.douban.com/').text soup = bs(content, 'lxml') soup. 这里soup后面可以跟各种方法。下面主要介绍实用的方法...原创 2019-02-10 20:36:09 · 416 阅读 · 0 评论 -
Python requests
快速上手 本页内容为如何入门 Requests 提供了很好的指引。其假设你已经安装了 Requests。 首先,确认一下: Requests 已安装 Requests 是最新的 让我们从一些简单的示例开始吧。 发送请求 使用 Requests 发送网络请求非常简单。 一开始要导入 Requests 模块: import requests 然后,尝试获取某个网页。本例子中,我们来获取 Gith...转载 2019-02-14 21:04:42 · 213 阅读 · 0 评论 -
git操作方式(gitee)
git命令 git init # 初始化 git status # 查看当前文件夹的状态 git add . # 对指定文件进行版本控制 git commit -m ‘描述版本信息(详细)’ # 创建提交记录 git log # 查看 git reflog # 所有 git reset --hard 提交记录(版本号) git命令二:新版本开发中做别的bug修复 方式一: git ...原创 2019-02-09 19:51:12 · 207 阅读 · 0 评论 -
Python爬虫之selenium
Selenium是一个用于测试网站的自动化测试工具,支持各种浏览器包括Chrome、Firefox、Safari等主流界面浏览器,同时也支持phantomJS无界面浏览器。 在web爬虫中,有些用Ajax加载的数据无法直接获取,这里selenium主要用于对页面JavaScript数据的提取以及交互操作。 以下代码可以分模块运行,本人亲测可以使用,读者可以体会一下使用selenium库的交互,即如...原创 2019-02-11 22:04:43 · 207 阅读 · 0 评论