在练习爬取小说过程中出现AttributeError: ‘NoneType‘ object has no attribute ‘find‘问题

Python解决AttributeError: 'NoneType' object has no attribute 'find'问题

在练习爬取小说过程中出现报错:Python解决AttributeError: 'NoneType' object has no attribute 'find'

因是新手,练习爬取时,是从第一章url开始爬取,用while循环在url后加页码的形式爬取,当页爬取完后,page_num += 1,爬取下一页。

详见以下代码:

# 设置尾页
page_num = 4885031
# 设置要请求的网页链接
while page_num < 10161977:
    url = 'https://www.ibiquge.la/7/7878/{}.html'.format(page_num)

如果按这样爬取,会出现问题,有可能下一章的url的尾页 不是page_num += 1,就会循环提取不到该网页,从而报错AttributeError: 'NoneType' object has no attribute 'find'。详见下图:

 

 如上图箭头,下一章的尾页不是累加,所以报错。

若要解决,建议:1.解析小说所有章节页;2.获取每章节链接后爬取

### 关于 Python 中 `AttributeError: 'NoneType' object has no attribute` 错误的解决方法 当遇到 `'NoneType' object has no attribute` 这类错误时,通常是因为试图访问或调用一个未被正确定义的对象的方法或属性。以下是针对该问题的具体分析和解决方案。 #### 1. **确认返回值是否为 None** 在许多情况下,这种错误可能源于某个函数未能成功执行并返回预期的结果,而是返回了 `None`。例如,在引用中提到的一个典型场景是: ```python def get_object(): return None obj = get_object() print(obj.x) # 引发 AttributeError,因为 obj 是 None,没有属性 x[^1] ``` 为了避免此类错误,可以在使用对象之前检查其是否存在以及是否具有所需的属性: ```python if obj is not None and hasattr(obj, 'x'): print(obj.x) else: print("Object is None or does not have the required attribute.") ``` --- #### 2. **确保 XML 或 HTML 解析节点有效** 另一个常见原因是解析器无法找到指定的标签或元素,从而返回 `None` 对象。例如,在引用中提到了一段代码片段: ```python Traceback (most recent call last): File "D:\IT DateFiles\PyDate\FQC\main.py", line 55, in <module> m_text = draw_item.find("m_text").text ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^ AttributeError: 'NoneType' object has no attribute 'text'[ ^3 ] ``` 在这种情况下,可以先验证 `.find()` 方法是否找到了目标节点。如果找不到,则会返回 `None`,进而引发此错误。可以通过以下方式改进代码逻辑: ```python element = draw_item.find("m_text") if element is not None: m_text = element.text print(m_text) else: print("Element 'm_text' not found.") ``` --- #### 3. **避免对未初始化变量的操作** 有时,错误可能是由于变量尚未正确初始化就尝试对其进行操作引起的。例如,引用中提到的原因之一就是“错误的变量初始化”。因此,应始终确保变量已被赋值后再对其执行任何操作。 --- #### 4. **注意框架特定的行为** 如果是基于某些库(如 Keras)开发的应用程序,还需要特别留意这些库内部实现细节可能导致的问题。比如,在 Keras 中处理张量切片时需要注意额外封装的要求,否则可能会触发类似的异常[^4]。下面是一个修正后的例子: ```python from keras.layers import Lambda import tensorflow as tf # 正确的方式是对切片操作应用 Lambda 封装 output_tensor = Lambda(lambda x: x[:, :, :, 1:])(input_tensor) ``` 如果不这样做而直接进行切片操作,则有可能导致层结构破坏,最终抛出 `AttributeError`。 --- ### 总结 为了防止出现 `'NoneType' object has no attribute` 类型的错误,请遵循以下几个原则: - 在访问对象属性前,务必验证它不为空; - 使用条件语句来捕获潜在的风险情况; - 阅读文档了解所使用的工具包是否有特殊规定需遵守。 ---
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值