
python
夏安code
夜里的繁星,此刻在日光深处
展开
-
python3 连接sql server数据库和简单sql执行
Python3连接数据库,首先下载连接sql server数据库的pymssql库。Python连接数据库很简单,也有很多库可以用,我用的比较常用的pymssql。连接数据库:connect = pymssql.connect(self.url,self.username,self.password,self.databaseName) ;获取游标:cursor = connect.c...原创 2020-02-12 11:42:19 · 2217 阅读 · 1 评论 -
Python3安装Django程序
一、pip安装比较方便的是使用pip安装,pip在安装Python库的时候很方便,建议用此方法。安装pip:进入cmd窗口,进入Python安装目录获得pip安装文件:curl https://bootstrap.pypa.io/get-pip.py -o get-pip.py安装pip:python get-pip.py看到successful就是安装成功了。...原创 2019-12-01 14:57:55 · 382 阅读 · 0 评论 -
入门小爬虫
python爬虫最基本流程是,获取请求,解析页面,处理页面数据 。python获取页面的的第三方库很多,像request,urllib,解析方法有最简单的re正则表达式,也有专门用来解析的库xmlx,beautifulSoup等。下面以request,正则表达式为例。一、获取请求,得到网页文本,先上代码:import requests#获取请求response = requests.g......原创 2019-09-19 08:47:11 · 569 阅读 · 0 评论 -
新人python爬虫请求出错常见错误
请求出错爬取页面开始没有问题,爬到某个时刻异常报错,如果是403错误,是被反爬抓到了。解决方法:1,设置headers,建一个user-agent池,每次用不同到user-agent访问,用来模拟不同浏览器访问页面2,设置代理池,每次用不同的ip3,设置延迟,time.sleep(random.randint(0,5)),改变抓取效率,防止被发现ConnectionRese...原创 2018-12-11 19:37:09 · 5477 阅读 · 0 评论 -
python爬虫之BeautifulSoup解析网页
BeautifulSoup是一个很简单又好用的库,不过解析速度相对比较慢,使用如下:1,安装pip install bs4 (被加到了bs4中) #python3用pip3 install bs4 ,如果有权限问题,可以试试,pip install bs4 --user2,导包from bs4 import BeautifulSoup3,使用代码from bs4 im...原创 2018-11-09 13:45:45 · 666 阅读 · 0 评论 -
python爬虫之lxml简单学习案例使用方法
使用BeautifulSoup和lxml,可以解析代码并不规范的网页,并补充代码方便解析。使用过BeatuifulSoup解析网页,解析速度上并没有lxml快,本人爬取过一个网站,用aiohttp+BeautifulSoup,协程一起爬20多个网页,由于解析超时会中断,改用lxml后,就没有出现这个问题,爬取速度提升了数倍。使用lxml步骤:1,引入包:from lxml import e...原创 2018-11-09 13:25:25 · 2706 阅读 · 1 评论