万能正则表达式
想要的东西都用括号括起来(.*?)
import re
html = """<div><p>阿三大苏打</p></div>
<div><p>撒旦富士康附近</p></div>
"""
# 贪婪匹配,re.S使 . 能匹配\n在内的所有字符
p = re.compile('<div><p>.*</p></div>',re.S)
r = p.findall(html)
print(r)
# 非贪婪匹配
p = re.compile('<div><p>(.*?)</p></div>',re.S)
r = p.findall(html)