将数据保存到TXT文本的操作非常简单,而且TXT文本几乎兼容任何平台,但是有一个缺点,就是不利于检索。所以如果对检索和数据结构要求不高,追求方便的话,可以采用TXT文本存储。本文中,我们就来看一下如何利用Python保存TXT文本文件。
1.设置目标
我们需要保存知乎上“发现”页面的“热门话题”部分,并将其问题和答案统一保存成文本形式。
2.具体的操作方法
我们先用requests将网页源代码获取下来,然后使用pyquery解析库解析,接下来将提取的标题、回答者、回答保存到文本,具体的代码如下:
import requests
from pyquery import PyQuery as pq
url='https://www.zhihu.com/explore'
headers = {
'User-Agent':'Mozilla/5.0 (iPhone; CPU iPhone OS 13_2_3 like Mac OS X) AppleWebKit/605.1.15 (KHTML, like Gecko) Version/13.0.3 Mobile/15E148 Safari/604.1'
}
html = requests.get(url,headers=headers).text
doc = pq(html)
items = doc('.explore-tab .feed-item').items()
for item in items:
question = item.find('h2').text()
author = item.find('.author-link-line').text()
an