优化-模块化代码

原创已于 2024-10-20 19:06:36 修改 · 138 阅读

0 ·

CC 4.0 BY-SA版权

文章标签：

#python #开发语言 #java

于 2024-10-20 17:35:01 首次发布

Java 专栏收录该内容

26 篇文章

订阅专栏

笔记

对上篇文章代码进行优化
weather.py

import requests
import re

# 定义函数
def get_html():
    url='http://www.weather.com.cn/weather1d/101010100.shtml' # 爬虫打开的浏览器上的网页
    resp=requests.get(url) # 打开浏览器并打开网址
    # 设置一下编码格式
    resp.encoding='utf-8'
    return resp.text

'''
<span class="name">三亚</span>
<span class="weather">多云</span>
<span class="wd">24/33℃</span>
<span class="zs">适宜</span>
'''

def parse_html(html_str):
    city=re.findall('<span class="name">([\u4e00-\u9fa5]*)</span>',html_str)
    weather=re.findall('<span class="weather">([\u4e00-\u9fa5]*)</span>',html_str)
    wd=re.findall('<span class="wd">(.*)</span>',html_str)
    zs=re.findall('<span class="zs">([\u4e00-\u9fa5]*)</span>',html_str)

    lst=[]
    for a,b,c,d in zip(city,weather,wd,zs):
        lst.append([a,b,c,d])

    return lst