Python3.0

本文介绍爬虫技术中常用的Python模块,包括发送HTTP请求、解析HTML/XML文档、处理URL及存储数据的方法。涉及requests、BeautifulSoup、lxml、json、csv等关键库。

爬虫运用的模块

#请求响应

import requests

import re

 

#解析文本

from bs4 import BeautifulSoup as  XX

from lxml import etree

import urllib.parse(等价于之前版本的 import urlparse)

数据存储

import json

       json.dump()                   json.load()

      json.dumps()                   json.loads()

import csv

      csv.writer()                    csv.reader()

      csv.writerow()               csv.writeeows()

文件流

import codecs

codecs.open()

#python 默认为ASCII码,此模块可以输入utf-8编码

### Python 3.0 的版本特性及使用说明 Python 3.0Python 编程语言的一个重要里程碑,标志着该语言的一次重大升级。它于2008年首次发布,旨在解决早期版本中存在的设计缺陷并清理冗余功能[^4]。 #### 主要特性 1. **向后不兼容** Python 3.0 对许多核心部分进行了重新设计,这使得其与之前的 Python 2.x 版本存在显著差异。例如,`print`语句被替换为 `print()` 函数,强制开发者采用更一致的调用方式[^5]。 2. **统一字符串处理** 在 Python 3.0 中,默认情况下所有的字符串都是 Unicode 字符串。这一改变消除了之前在不同编码之间转换时可能遇到的问题,同时也让国际化支持更加简单直观[^6]。 3. **整数除法行为调整** 整型之间的除法运算现在返回浮点数值而非截断后的整数结果。比如,在 Python 2 中执行 `5 / 2` 得到的是 `2`;而在 Python 3 中同样的表达式则会产生精确的结果 `2.5`[^7]。 4. **增强异常机制** 异常对象不再只是简单的类实例,而是具备更多属性和方法的对象结构体。此外,“as”关键字用于捕获特定类型的错误变得更为常见且必要[^8]。 5. **迭代器取代列表推导式的默认实现形式** 这一改动提高了程序运行效率的同时减少了内存占用量。例如 `[i*i for i in range(10)]` 将生成一个可遍历序列而不是完整的数组副本[^9]。 #### 使用注意事项 由于上述提到的一些关键变化可能导致现有基于旧版开发的应用无法正常工作,因此当考虑迁移到 Python 3 系列时需特别留意这些方面的影响,并做好充分准备以应对可能出现的各种挑战[^10]。 ```python # 示例代码展示如何利用Python 3的新特性和最佳实践编写高效安全的脚本 def divide(a, b): try: result = a / b except ZeroDivisionError as e: print(f"Error occurred: {e}") return None else: return result if __name__ == "__main__": num1 = int(input("Enter first number: ")) num2 = int(input("Enter second number: ")) output = divide(num1, num2) if output is not None: print(f"The division of {num1} by {num2} equals to {output}.") ```
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值