获取文件下载链接后缀或文件名后缀

荔枝吻

于 2025-02-24 20:45:53 发布

阅读量261

点赞数 2

分类专栏： Python # 爬虫文章标签： python 爬虫

本文链接：https://blog.youkuaiyun.com/AlienProgrammer/article/details/145837646

版权

爬虫同时被 2 个专栏收录

2 篇文章

订阅专栏

Python

1 篇文章

订阅专栏

在写爬虫爬取下载链接来下载文件时，需要判断文件下载链接的后缀来命名文件，可以使用os库中获取文件名后缀的方法

完整下载链接：

import os

# 完整下载链接
link = "https://html/sm01.pdf"

# 使用os.path.splitext()获取路径和后缀
path, suffix = os.path.splitext(link)

print("路径:", path)  # 输出: 路径: https://html/sm01
print("后缀:", suffix)  # 输出: 后缀: .pdf

在这里插入图片描述

下载链接尾部片段：

import os

# 下载链接片段
link = "html/sm01.pdf"

# 使用os.path.splitext()获取路径和后缀
path, suffix = os.path.splitext(link)

print("路径:", path)  # 输出: 路径: html/sm01
print("后缀:", suffix)  # 输出: 后缀: .pdf