<div class="tit">
Python 获取网页内容</div>
<div class="date"><br></div>
<p>
url = 'http://www.XXX.com'<br><br>
1. 使用urllib or urllib2<br><br>
import urllib2<br>
urllib2.urlopen( url ).read()<br>
urllib2.urlopen( url ).read().<span style="color: #000000;">decode(</span>
<span style="color: #800000;">'</span>
<span style="color: #800000;">utf-8</span>
<span style="color: #800000;">'</span>
<span style="color: #000000;">)<br><br>
2. python调用 curl<br><br>
import os, sys<br>
os.system('curl ' + url)<br>
os.system('curl -D header.txt ' + url)</span>
</p>
Python 获取网页内容</div>
<div class="date"><br></div>
<p>
url = 'http://www.XXX.com'<br><br>
1. 使用urllib or urllib2<br><br>
import urllib2<br>
urllib2.urlopen( url ).read()<br>
urllib2.urlopen( url ).read().<span style="color: #000000;">decode(</span>
<span style="color: #800000;">'</span>
<span style="color: #800000;">utf-8</span>
<span style="color: #800000;">'</span>
<span style="color: #000000;">)<br><br>
2. python调用 curl<br><br>
import os, sys<br>
os.system('curl ' + url)<br>
os.system('curl -D header.txt ' + url)</span>
</p>
本文介绍两种使用Python获取网页内容的方法:一是利用urllib2模块直接读取URL内容;二是通过os模块调用curl命令抓取网页。文中提供了具体的Python代码示例。
2930

被折叠的 条评论
为什么被折叠?



