Python天天美味(28) - urlopen

本文介绍了Python中使用urllib模块进行网络编程的基本操作,包括如何通过urlopen获取网页内容及HTTP头部信息,如何设置和使用代理服务器等。这些知识点对于初学者理解和实践Python网络爬虫非常有用。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

一、打开一个网页获取所有的内容


  from  urllib  import  urlopen
doc 
=  urlopen( " http://www.baidu.com " ).read()
print  doc


二、获取Http头


from  urllib  import  urlopen
doc 
=  urlopen( " http://www.baidu.com " )
print  doc.info()
print  doc.info().getheader( ' Content-Type ' )


 三、使用代理

    1. 查看环境变量


print   "" n " .join([ " % s =% s "  % (k, v)  for k, v in os.environ.items()])
print  os.getenv( " http_proxy " )


    2. 设置环境变量


import    os 
os.putenv(
" http_proxy " ,    " http://proxyaddr:<port> " )


     3. 使用代理


#  Use http://www.someproxy.com:3128 for http proxying
proxies  =  { ' http ' ' http://www.someproxy.com:3128 ' }
filehandle 
=  urllib.urlopen(some_url, proxies = proxies)
#  Don't use any proxies
filehandle  =  urllib.urlopen(some_url, proxies = {})
#  Use proxies from environment - both versions are equivalent
filehandle  =  urllib.urlopen(some_url, proxies = None)
filehandle 
=  urllib.urlopen(some_url)

 

Python 天天美味系列(总)

Python 天天美味(26) - __getattr__与__setattr__  

Python 天天美味(27) - 网络编程起步(Socket发送消息)  

Python 天天美味(28) - urlopen    

Python 天天美味(29) - 调用VC++的动态链接库(DLL) 

Python 天天美味(30) - python数据结构与算法之快速排序 

..
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值