- 博客(9)
- 收藏
- 关注
转载 SQL语句
SQL语句参考,包含Access、MySQL 以及 SQL Server 基础 创建数据库CREATE DATABASE database-name 删除数据库drop database dbname备份sql server创建 备份数据的 device USE masterEXEC sp_addumpdevice 'disk', 'testBack', 'c:\mssql7backup\My
2017-08-15 19:18:34
270
原创 Scrapy框架爬取详细步骤
Scrapy框架(本文只做学习使用,请勿他用)1.需求工具 pycharm 小说网的域名 (www.qisuu.com)第一步—–创建文件创建成功后显示如图:第二步——将创建在桌面上的scrapy文件用pycharm打开:这是创建成功后在pycharm中的显示pycharm左下角打开 Terminal打开后如图 我第一次键入了一条命令 提示爬虫名字不能和项目名称一样,更改后再运行..成功建立爬虫
2017-08-10 20:47:03
5496
原创 多线程实际应用
# -*- coding:utf-8 -*-import sysreload(sys)sys.setdefaultencoding("utf-8")import requestsfrom Queue import Queuefrom lxml import etreeimport threadingfrom time import sleepimport codecsfile
2017-08-09 15:51:55
352
原创 多线程基础
# -*- coding: utf-8 -*-import requestsimport threadingimport sysfrom time import sleepreload(sys)sys.setdefaultencoding("utf-8")# 单线程: 顺序执行, 如果第一个人没有执行完, 第二个不能开始# 体验: 执行代码需要等待,有可能卡死# ctrl+d
2017-08-09 10:18:54
285
原创 xpath爬取首页信息,并获取详情页标题与时间
# -*- coding: utf-8 -*-# url为 伯乐在线文章首页import sysimport requestsfrom lxml import etreeimport randomimport codecsreload(sys)sys.setdefaultencoding("utf-8")def download_page(url): user_age
2017-08-08 16:48:00
5078
原创 xpath 具体应用
# -*- coding: utf-8 -*-import sysimport requestsfrom lxml import etreeimport codecsreload(sys)sys.setdefaultencoding("utf-8")# 51job最新文章首页源码 3.html 存本地使加快请求速度# open后为路径 建议用相对路径 第一个点表示当前文件上一级路
2017-08-08 15:32:21
402
原创 xpath基本用法
讲解xpath基本语法---数据来源 伯乐在线 网页代码 1. 匹配某个/些元素 //img 匹配网页内的所有或一个img元素 2. 根据id匹配某个元素 //div[@id='logo'] 3. 根据class匹配某个元素 //div[@class='leaderboard-true'] 4. 通用写法 //div[@属性名='属性内容'] 5. 查找
2017-08-08 11:52:52
405
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人