Python 在Excel中插入、修改、提取和删除超链接

该文章已生成可运行项目,

目录

使用工具

Python在Excel中插入超链接

Python修改Excel中的超链接

Python提取Excel中的超链接

Python删除Excel中的超链接


超链接是Excel中的常用功能,通过点击超链接可以快速跳转到外部网站、本地文件或工作表中的特定单元格,有效提升数据访问的效率和用户体验。在日常工作中,我们可能需要在Excel表格中插入超链接以便快速访问,根据需求修改或删除已有超链接,或提取超链接的目标地址以进行进一步处理。这篇博客将详细介绍如何使用Python在Excel中插入、修改、提取和删除超链接

  • Python在Excel中插入超链接
  • Python修改Excel中的超链接
  • Python提取Excel中的超链接
  • Python删除Excel中的超链接

使用工具

要在Python中实现在Excel中插入、修改、提取和删除超链接,首先需要安装Excel文件处理库。本文所使用的库是Spire.XLS for Python,它可以通过以下pip命令进行安装:

pip install Spire.XLS

Python在Excel中插入超链接

Spire.XLS for Python 提供了 Worksheet.HyperLinks.Add() 方法,用于给工作表中的单元格添加文本超链接。添加后,可以给超链接设置不同的目标位置,如外部网页、本地文件、工作表中的其他单元格、电子邮件地址等。此外,该库还支持为工作表中的图片添加超链接,使图片变为可点击的元素,从而进一步提升 Excel 的交互性。

以下是给Excel工作表添加文本超链接和图片超链接的具体步骤:

  • 创建Workbook类的对象,并使用Workbook.Worksheets[index]属性获取特定工作表。
  • 使用Worksheet.Range[]属性获取特定单元格。
  • 使用Worksheet.HyperLinks.Add() 方法给单元格添加文本超链接,并设置文本超链接的类型、显示文本和目标地址。
  • 使用Worksheet.Pictures.Add()方法向工作表的特定单元格插入图片。
  • 使用XlsBitmapShape.SetHyperLink()方法为图片设置超链接。
  • 使用Workbook.SaveToFile()方法保存结果文档。

实现代码:

from spire.xls import *
from spire.xls.common import *

# 创建Workbook对象
workbook = Workbook()

# 获取第一个工作表
sheet = workbook.Worksheets[0]

# 添加指向外部网页的文本超链接
cell1 = sheet.Range["B2"]
webLink = sheet.HyperLinks.Add(cell1)
webLink.Type = HyperLinkType.Url
webLink.TextToDisplay = "Baidu.com"
webLink.Address = "https://baidu.com/"

# 添加指向电子邮件地址的文本超链接
cell2 = sheet.Range["B4"]
mailLink = sheet.HyperLinks.Add(cell2)
mailLink.Type = HyperLinkType.Url
mailLink.TextToDisplay = "联系我们"
mailLink.Address = "mailto:support@mycompany.com"

# 添加指向外部文件的文本超链接
cell3 = sheet.Range["B6"]
fileLink = sheet.HyperLinks.Add(cell3)
fileLink.Type = HyperLinkType.File
fileLink.TextToDisplay = "打开 报表.xlsx"
fileLink.Address = "C:\\Users\\Administrator\\Desktop\\报表.xlsx"

# 添加指向同一工作簿中其他单元格的文本超链接
cell4 = sheet.Range["B8"]
linkToSheet = sheet.HyperLinks.Add(cell4)
linkToSheet.Type = HyperLinkType.Workbook
linkToSheet.TextToDisplay = "跳转到Sheet2!A1"
linkToSheet.Address = "Sheet2!A1"

# 在工作表中插入图片
image = sheet.Pictures.Add(10, 2, "baidu.png")
image.LeftColumnOffset = 25
image.TopRowOffset = 25
# 为图片添加超链接
image.SetHyperLink("https://baidu.com/", True)

# 设置列宽和行高
sheet.SetColumnWidth(2, 17)
sheet.SetRowHeight(10, image.Height)

# 保存结果文件
workbook.SaveToFile("添加超链接.xlsx", ExcelVersion.Version2016)
workbook.Dispose()

Python 插入超链接到Excel单元格

Python修改Excel中的超链接

当超链接的目标地址失效或发生变更时,需要及时更新以确保数据的准确性。

以下是修改Excel工作表中特定的超链接的核心步骤:

  • 使用 Worksheet.HyperLinks[index] 属性获取特定的超链接。
  • 通过HyperLink.TextToDisplayHyperLink.Address 属性来更新超链接的显示文本和目标地址。

实现代码:

from spire.xls import *
from spire.xls.common import *

# 创建Workbook对象
workbook = Workbook()
# 加载Excel文档
workbook.LoadFromFile("添加超链接.xlsx")

# 获取第一个工作表
sheet = workbook.Worksheets[0]

# 获取工作表中的第一个超链接
link = sheet.HyperLinks[0]

# 修改超链接的显示文本
link.TextToDisplay = "优快云"
# 修改超链接的目标地址
link.Address = "https://www.youkuaiyun.com/"

# 保存结果文档
workbook.SaveToFile("修改超链接.xlsx", ExcelVersion.Version2016)
workbook.Dispose()

Python 修改Excel超链接

Python提取Excel中的超链接

由于Excel工作表可能包含文本超链接和图片超链接,因此需要分别对它们进行提取。

以下是从Excel工作表中提取文本超链接和图片超链接的核心步骤:

  • 使用Worksheet.HyperLinks属性获取该工作表中文本超链接的集合。
  • 循环遍历集合,使用HyperLink.Address属性获取每个文本超链接的目标地址,并将其添加到列表。
  • 使用Worksheet.Pictures属性获取该工作表中图片的集合。
  • 循环遍历集合,使用XlsBitmapShape.GetHyperLink()方法获取图片的超链接。
  • 使用HyperLink.Address属性获取每个图片超链接的目标地址,并将其添加到列表。
  • 将列表内的地址写入文本文件。

实现代码:

from spire.xls import *
from spire.xls.common import *

# 创建Workbook对象
workbook = Workbook()
# 加载Excel文档
workbook.LoadFromFile("添加超链接.xlsx")

# 获取第一个工作表
sheet = workbook.Worksheets[0]

# 获取工作表中所有文本超链接的集合
links = sheet.HyperLinks

# 创建列表来存储提取的超链接信息
list = []

# 遍历提取的文本超链接
for link in links:
    # 获取每个超链接的地址
    address = link.Address
    # 将地址添加到列表
    list.append(address)

# 遍历工作表中的所有图片
imageCollection = sheet.Pictures
for image in imageCollection:
    # 获取图片超链接的地址
    link = image.GetHyperLink()
    address = link.Address
    list.append(address)

# 将提取的超链接地址写入文本文件
with open("超链接.txt", "w", encoding = "utf-8") as file:
    for item in list:
        file.write(item + "\n")

workbook.Dispose()

Python 获取Excel表格里的超链接

Python删除Excel中的超链接

当不再需要某些超链接时,可以将其删除。Spire.XLS for Python提供了Worksheet.Range[].HyperLinks.RemoveAt()方法,支持删除工作表特定单元格中的超链接。此外,也支持删除整个工作表中的所有超链接。

以下是从Excel工作表中删除特定单元格的超链接或所有超链接的实现代码:

from spire.xls import *
from spire.xls.common import *

# 创建Workbook对象
workbook = Workbook()
# 加载Excel文档
workbook.LoadFromFile("添加超链接.xlsx")

# 获取第一个工作表
sheet = workbook.Worksheets[0]

# # 删除特定单元格中的文本超链接
# sheet.Range["B2"].HyperLinks.RemoveAt(0)

# 获取文本超链接的集合
links = sheet.HyperLinks

# 从后往前遍历集合,依次删除集合中的文本超链接
for i in range(links.Count - 1, -1, -1):
    links.RemoveAt(i)

# 保存结果文档
workbook.SaveToFile("删除超链接.xlsx", ExcelVersion.Version2016)
workbook.Dispose()

以上就是使用Python在Excel中插入、修改、提取和删除超链接的全部内容。感谢阅读!

本文章已经生成可运行项目
<think>我们正在处理Excel中的三种图片类型:注释图片、链接图片(超链接指向的图片)嵌入图片(直接插入的图片)。用户要求区分Python提取这三类图片的方法区别。 注意:在Excel中,没有“注释图片”这一标准术语。通常,注释中只能添加文本。但用户可能指的是单元格注释中插入的图片?实际上,Excel注释(新版中称为“批注”)可以包含图片。 因此,我们重新定义三类: 1. 嵌入图片:直接插入到工作表上的图片。 2. 注释(批注)图片:在批注背景中插入的图片。 3. 链接图片:这里可能指两种:一种是超链接指向的图片(不在Excel内),另一种是链接到外部文件但显示在Excel中的图片?但通常,链接图片是指通过超链接方式引用的图片,而嵌入图片是直接保存在文件内部的。 根据用户的问题引用内容,我们重点区分: - 嵌入图片:存储在Excel文件内部的图片对象。 - 批注中的图片:存储在批注背景中的图片。 - 超链接指向的图片:仅是一个URL,图片不在Excel文件中,需要下载。 因此,我们将从以下几个方面回答: 1. 嵌入图片:使用openpyxl可以直接提取二进制数据。 2. 批注中的图片:需要使用特定方法(如openpyxl也可以,但处理方式略有不同)提取。 3. 链接图片(超链接):只是一个文本链接,需要另外用网络请求下载。 但请注意:用户问题中提到了“链接图片”,可能还有一种情况:在Excel单元格中插入的图片是链接到外部文件的(嵌入时选择链接到文件),这样Excel中只保存链接缩略图?实际上,在Excel插入图片时有两种方式:嵌入链接。链接方式不会将图片数据存入Excel,而是存储一个路径(可以是网络URL或本地路径),打开时动态加载。 因此,我们区分: - 嵌入图片:图片数据存储在Excel文件中。 - 链接图片(外部链接图片):图片数据不在Excel文件中,只存储路径或URL,打开时加载(如果断开链接则无法显示)。 - 批注中的图片:实际上也是嵌入的一种,但存储在批注中。 接下来,我们分别说明如何用Python提取这三类图片: 一、嵌入图片(直接插入工作表的图片): 使用openpyxl库,通过`ws._images`获取图片对象,然后提取二进制数据保存。 二、批注中的图片(插入到批注背景的图片): 批注中可能包含图片背景。在openpyxl中,单元格的批注(Comment)对象可能有背景图片。我们可以通过`cell.comment`获取批注,然后检查是否有填充图片(fill)。但openpyxl目前不支持直接提取批注中的图片(需要进一步处理)。 三、链接图片: 分为两种情况: a) 超链接指向的图片:单元格中是一个超链接(文本),指向一个图片URL。我们可以提取这个URL,然后用requests下载图片。 b) 链接到外部的图片(在Excel中显示为图片对象,但实际是链接的):这种图片对象在Excel中存储的是链接信息,而不是完整的图片数据。在openpyxl中,这种图片对象与嵌入图片在同一列表(`ws._images`)中,但获取到的数据可能只是一个占位图?或者根本获取不到真实图片?因此,我们需要检查图片对象是否有链接属性,如果有,则根据链接下载原始图片。 然而,需要注意的是:openpyxl目前(3.0.9版本)不支持读取链接图片(即只存储链接的图片)的实际图片数据,因为它只存储链接。在读取时,openpyxl会将链接图片当作普通嵌入图片读取吗?不会,因为链接图片在Excel中存储的是链接,openpyxl只能读取到占位图(如果Excel保存时同时保存了缩略图)或者无法读取(如果没有保存缩略图)。 因此,我们重新整理: 1. **嵌入图片**:图片数据完整存储在Excel文件中,使用openpyxl可提取。 2. **批注中的图片**:存储在批注中,openpyxl只能获取到批注对象,但提取图片需要特殊处理(可能无法直接提取)。 3. **链接图片**(包括两种): - 单元格超链接指向的图片:只是一个URL,用`cell.hyperlink`获取URL,然后用requests下载。 - 作为图片对象插入但链接到外部的图片:在openpyxl中,这种图片对象在`ws._images`中,但图片数据可能是缩略图或者占位图,并非原图。我们需要通过图片对象的属性(如果有)获取链接,然后下载原图。但遗憾的是,openpyxl没有提供这样的属性。 由于openpyxl对链接图片(第二种)支持有限,我们可能需要使用其他库(如xlwings,win32com)来提取链接信息。 考虑到用户要求Python实现,我们分情况给出代码示例: 一、提取嵌入图片(包括工作表上的嵌入图片批注中的图片): 实际上,批注中的图片在openpyxl中无法直接提取。因此,我们可能需要使用其他方法(如win32com)来提取批注中的图片。 因此,针对三种情况的提取方法差异较大,使用的工具也不同。 下面我们详细说明: ### 1. 工作表嵌入图片(Embedded Pictures in Worksheet) - **存储位置**:直接放置在工作表上,存储在Excel文件内部。 - **提取方法**: 使用`openpyxl`库,通过`worksheet._images`列表获取所有图片对象(`openpyxl.drawing.image.Image`)。每个图片对象包含二进制数据。 - **代码示例**: ```python from openpyxl import load_workbook wb = load_workbook('example.xlsx') ws = wb.active for idx, img in enumerate(ws._images): # 保存图片 with open(f'embedded_image_{idx}.png', 'wb') as f: f.write(img._data()) ``` - **特点**:提取的是完整的嵌入图片数据[^1]。 ### 2. 批注中的图片(Picture in Comment) - **存储位置**:作为单元格批注的背景图片,存储在Excel文件内部。 - **提取方法**: `openpyxl`无法直接提取批注中的图片。需要借助其他库(如`win32com`)来操作Excel提取批注图片。 - **代码示例(使用win32com)**: ```python import win32com.client from PIL import ImageGrab excel = win32com.client.Dispatch("Excel.Application") excel.Visible = False wb = excel.Workbooks.Open(r"C:\path\to\your\file.xlsx") ws = wb.Worksheets("Sheet1") # 遍历所有有批注的单元格 for cell in ws.UsedRange: if cell.Comment is not None: # 获取批注对象 comment = cell.Comment # 批注形状 shape = comment.Shape # 复制批注形状到剪贴板 shape.Copy() # 从剪贴板获取图片 img = ImageGrab.grabclipboard() if img: img.save(f"comment_image_{cell.Address}.png") wb.Close() excel.Quit() ``` - **特点**:需要依赖Excel应用程序,且仅适用于Windows环境[^2]。 ### 3. 链接图片(Linked Pictures) 分为两种情况: #### a) 单元格超链接指向的图片(Hyperlink to an Image) - **存储位置**:仅存储图片URL或文件路径,图片数据在外部。 - **提取方法**: 1. 使用`openpyxl`获取单元格超链接。 2. 使用`requests`下载网络图片,或使用`shutil.copy`复制本地图片。 - **代码示例**: ```python import requests from openpyxl import load_workbook import os from urllib.parse import urlparse wb = load_workbook('example.xlsx') ws = wb.active for row in ws.iter_rows(): for cell in row: if cell.hyperlink and cell.hyperlink.target: url = cell.hyperlink.target # 简单判断是否为图片(根据扩展名) if url.lower().endswith(('.png', '.jpg', '.jpeg', '.gif')): # 如果是网络URL if url.startswith('http'): response = requests.get
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值