读取ppt文档内容

ppt结构
Slide:幻灯片页
Shape:形状,类似于文字框
Shape中包括Paragraph段落
Paragraph段包括run

获取Slide
from pptx import Presentation
prs=Presentation(‘XXX.pptx’)
for slide in prs.slides:
#.slides得到一个列表,包含了每个slide
print(slide)
获取形状shape
for slide in prs.slides;
for shape in slide.shapes;
#slide.shapes形状
print(shape)
判断一个shape中是否存在文字
for slide in prs.slides:
for shape in slide.shapes:
if shape.has_text_frame:
#shape.has_text_frame:是否有文字
text_frame=shape.text_frame
#shape.text_frame:获取文字框
print(text_frame.text)
从shape中找出paragraphs
for paragraph in text_frame.paragrahs:
print(paragraph.text)

学习链接:https://www.bilibili.com/video/BV197411f7Rp

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值