
数据分析
医然
天行健,君子以自强不息!
展开
-
Python 读取PDF表格
Python读取excel里面的表格,并保存为xlsx一、安装模块:import pdfplumberimport pandas as pddef pdf_read(): pdf = pdfplumber.open("aaaa.pdf") #pages=input("转换表格的页码") p0=pdf.pages[37] table=p0.extract_table() print(table) df=pd.DataFrame(table[1:], ...原创 2021-06-21 14:47:53 · 688 阅读 · 0 评论 -
python 数据处理笔记
`1.打开文件,读取普通文件一.使用open函数获取文件内容:f=open("C:\\a.txt")a=f.read() #读取所有b=f.readline() #读取一行c=f.readlines() #读取所有行二.使用linecache模块获取文件内容:import linecachea=linecache.getline("C:\\a.txt",2)#读取第二行b=lin...原创 2018-07-18 23:34:09 · 735 阅读 · 1 评论 -
python html 解析与正则表达式
#正则表达式1.正则表达式的特殊字符^/$开始/结束 \w/\W匹配字母,数字,下划线/相反\s/\S匹配空白字符/相反 \d/D匹配数字/相反\b/\B匹配单词开始和结束的位置/相反 .匹配任意字符[m]匹配单个字符串 [m1m2...n]匹配多个字符串[m-n]匹配m-n区间的数字,字母 [^m]匹配除m以外的字符串()对正则表达式进行分组2.正则表达式中的常用限...原创 2018-06-30 00:55:29 · 4228 阅读 · 0 评论 -
Python Spark Windows10 环境配置
我的环境是Windows10 64位+Python3.6一、下载 Hadoop:https://dist.apache.org/repos/dist/release/hadoop/common/hadoop-3.1.1/二、下载 Spark:https://archive.apache.org/dist/spark/spark-2.3.1/三、把以上两个文件解压到指定目录存放四、添...原创 2018-09-11 11:48:03 · 714 阅读 · 0 评论 -
Python numpy简单使用
import numpy as np NumPy 中定义的最重要的对象是称为 ndarray 的 N 维数组类型。 它描述相同类型的元素集合。 可以使用基于零的索引访问集合中的项目。ndarray中的每个元素在内存中使用相同大小的块。 ndarray中的每个元素是数据类型对象的对象(称为 dtype)。从ndarray对象提取的任何元素(通过切片)由一个数组标量类型的 Python 对...原创 2018-07-22 19:26:25 · 4255 阅读 · 0 评论 -
Python 串口读写
如果没有安装 pyserial 则需要安装:pip install pyserial import serialimport threadingimport timeser = serial.Serial('COM1', 9600)def sends(): """ 发送数据 """ while True: inp = input("请输...原创 2018-09-11 20:27:15 · 5241 阅读 · 0 评论 -
Python 常用排序
经典排序算法:def selecton_sort(p): """ 选择排序 p: 数字列表 """ for i in range(len(p) - 1): min = i for j in range(i + 1, len(p)): if p[min] > p[j]: ...原创 2018-09-18 18:48:49 · 209 阅读 · 0 评论 -
Python 压缩与解压
需要用到两个库,zipfile、tarfileimport zipfileimport tarfiledef compress(paths,files): """ 压缩 支持zip、tar paths:压缩文件路径(D:\\a.zip),files:要压缩的文件列表[a.txt,b.txt] """ if paths.endswith('.zip'): z =...原创 2018-10-10 19:32:51 · 570 阅读 · 1 评论