
错误问题收集
huiyinimen
这个作者很懒,什么都没留下…
展开
-
Camelot安装与使用 获取pdf中的表格
安装 Camelot安装所需的文件的下载地址https://www.lfd.uci.edu/~gohlke/pythonlibs/#wordcloudpip install opencv_python-4.1.2-cp37-cp37m-win_amd64.whl import camelottables = camelot.read_pdf('mypdf.pdf')print(ta...原创 2020-03-22 17:28:51 · 4262 阅读 · 0 评论 -
CSV 格式文件转 xlsx 文件
CSV 格式文件转 xlsx 文件获取pdf表格中的内容pdf内容格式如下:import pdfplumberimport pandas as pdpdf = pdfplumber.open(r'C:\Users\86159\Desktop\问题总结.PDF')p = pdf.pages[0]print(p.extract_text())#获取所有内容table = p.ext...原创 2019-11-23 12:27:24 · 484 阅读 · 0 评论 -
提取word中表格内容
提取 Word 表格内容import docxdocName = "C:/Users/Desktop/信息.docx"# 打开文档docStr = docx.Document(docName)# 获取Word文档中所有表格numTables = docStr.tables# 把数据放到列表中my_list = []for table in numTables: # ...原创 2019-11-23 12:23:28 · 1918 阅读 · 0 评论 -
打开excel文件报错处理
打开excel报错处理解决方法:利用 pandas 库中的read_html快速获取在html中页面中table格式的数据import osimport pandas as pddef read_xls_html(fname): df=None try: f = open(fname,'r',encoding='utf-8') table_s...原创 2019-11-23 12:12:02 · 733 阅读 · 0 评论 -
打开网页速度慢的原因和解决方法
打开网页速度慢的原因和解决方法1、原因一:http请求次数太多解决:减少http请求次数① 图片地图:把多张图片整合到一张图片中,以位置定位超链接。② CSS Sprites合并图片,通过指定CSS的backgroud-image和backgroud-position来显示元素。③ 合并JS脚本和CSS样式表。④ 使用外部JS和CSS文件。2、原因二:接收数据时间过长,如下载资源过...原创 2018-10-31 22:38:18 · 6613 阅读 · 0 评论