import:BeautifulSoup,selenium
text1 = soup.find(class_='hot_recommend').find_all('p')
print(text)输出的text是/u开头字符串
以为是编码的原因
最后发现只要把text分行输出即可
for text in text1:
text_w = str(text)
#text_w.encode('utf-8')
print(text_w)
f.write(text_w)
f.write("\n")
print("Write over~~~~~~~~~~~~~~~~~~~~~~~~~~~~~")
本文介绍了一种使用Python的BeautifulSoup库处理特定HTML元素的方法。通过遍历并分行输出找到的文本,解决了从HTML中提取的数据为特殊字符串格式的问题。
829

被折叠的 条评论
为什么被折叠?



