使用select方法时会获取到后续子节点的所有文本,之前解决的办法时使用lxml库进行提取,很麻烦,终于找到了一个方法:.contents[0]
soup=BeautifulSoup(response.text,'lxml') a=soup.select('li a')[0]
获取a标签内的文本 而不获取a标签下的子节点的文本:
title=a.contents[0]
使用select方法时会获取到后续子节点的所有文本,之前解决的办法时使用lxml库进行提取,很麻烦,终于找到了一个方法:.contents[0]
soup=BeautifulSoup(response.text,'lxml') a=soup.select('li a')[0]
获取a标签内的文本 而不获取a标签下的子节点的文本:
title=a.contents[0]