使用urllib包 urllib.request.open()打开网页 使用encode()decode()解码
•URL的一般格式为(带方括号[]的为可选项):
protocol :// hostname[:port] / path /[;parameters][?query]#fragment
•URL由三部分组成:
–第一部分是协议:http,https,ftp,file,ed2k…
–第二部分是存放资源的服务器的域名系统或IP地址(有时候要包含端口号,各种传输协议都有默认的端口号,如http的默认端口为80)。
第三部分是资源的具体地址,如目录或文件名等
本文介绍了如何使用Python的urllib库来打开网页,并解析URL的组成部分。详细解释了URL的标准格式,包括协议、主机名、端口号、路径、参数、查询字符串及片段标识符等。
585

被折叠的 条评论
为什么被折叠?



