
python
口袋里的小小哥
菜鸡互啄
展开
-
python读pdf
这里layout是一个LTPage对象,里面存放着这个page解析出的各种对象,一般包括LTTextBox, LTFigure, LTImage, LTTextBoxHorizontal等等,想要获取文本就获得对象的text属性,for page in PDFPage.create_pages(doc): # doc.get_pages() 获取page列表。# 创建一个PDF解释器对象,对文档编码,解释成Python能够识别的格式:PDFPageInterpreter。# 需要写出编码格式。原创 2022-11-17 13:57:52 · 1217 阅读 · 0 评论 -
python获取dos窗口/cmd/pycharm Terminal命令返回详情
python获取dos窗口/cmd/pycharm Terminal命令返回详情原创 2022-11-16 10:48:00 · 1061 阅读 · 0 评论 -
RSA通用模板 python,简单易懂
RSA+python原创 2022-10-28 14:56:52 · 931 阅读 · 0 评论 -
python切割图片
图片切割原创 2022-10-24 14:53:05 · 1044 阅读 · 0 评论 -
背景图片拼接,两张图片拼接
拼接方法有了,其他的自己看jy验证码原创 2022-10-24 14:50:41 · 316 阅读 · 0 评论 -
解决Python3 No module named ‘_sqlite3‘错误
_sqlite3错误解决原创 2022-10-14 17:35:05 · 1083 阅读 · 0 评论 -
ModuleNotFoundError: No module named ‘_lzma‘
centos ModuleNotFoundError: No module named ‘_lzma‘ 解决原创 2022-10-14 17:29:43 · 5233 阅读 · 4 评论 -
python写入excel(言简意赅最好用)
import xlwtbook = xlwt.Workbook() #创建Excelsheet = book.add_sheet('sheet1') #创建sheet页data = [ ["A",99,100,98.5], ["B",90,30.5,95], ["C",67.5,49.6,88] ]title = ['姓名','语文成绩','数学成绩','英语成绩'] #把表头名称放入list里面#循环把表头写入row = 0for t in title.原创 2022-04-28 17:50:20 · 6356 阅读 · 6 评论 -
python 将二维码转真实url
二维码转链接import requests from pyzbar.pyzbarimport decodefrom PIL import Imagefrom io import BytesIO# 传入二维码图片链接,返回扫码后的真实urldef get_url(url): res=requests.get(url=url).content bio = BytesIO(res) img = Image.open(bio) barcodes = d...原创 2021-12-31 15:40:17 · 2718 阅读 · 0 评论 -
centos装python3.7
Centos7安装Python3.7说明全部操作都在root用户下执行1.安装编译相关工具yum -y groupinstall "Development tools"yum -y install zlib-devel bzip2-devel openssl-devel ncurses-devel sqlite-devel readline-devel tk-devel gdbm-devel db4-devel libpcap-devel xz-develyum install lib原创 2021-09-02 10:59:23 · 88 阅读 · 0 评论 -
&#x 加密解密
1. 电话号码code_list='򈊷򈊻򈊼򈊹򈊷򈊸򈊼򈊽򈊽򈊽򈊷'2. 要转换为16进制,需要把&#替换为0# 替换&#为0,用于后面直接转换为10进制数code_list=code_list.replace("&#原创 2020-11-09 18:10:40 · 1674 阅读 · 0 评论 -
mongodb查询
for i in collection.find({"raw":{"$exists":True},"raw3":{"$exists":False}},no_cursor_timeout=True).batch_size(100):原创 2020-10-14 17:12:11 · 116 阅读 · 0 评论 -
pandas 新增sheet,不覆盖原来已经保存的sheet(亲测管用)
#以前的sheet数据很重要,又要新增sheet,很难受,看了一堆帖子没一个回答在点子上,找到了方法,分享给大家import openpyxlimport pandas as pdweatherfile = "0317.xlsx" #路径writer = pd.ExcelWriter(weatherfile,engine='openpyxl')pd_data=pd.DataFrame(数据) #writer = pd.ExcelWriter(weatherfile,...原创 2020-06-02 14:49:02 · 10107 阅读 · 13 评论 -
找遍全网最简单的使用git
2、进行基础配置,作为 git 的基础配置,作用是告诉 git 你是谁,你输入的信息将出现在你创建的提交中,使用下面两条命令: git config --global user.name"你的名字或昵称" git config --global user.email"你的邮箱"3.、在你自己人员文件夹中执行下面命令,完成初始化 git init ...原创 2020-04-10 10:33:16 · 163 阅读 · 0 评论 -
调参优化
import tensorflow as tfimport numpy as npimport pandas as pdimport matplotlib.pyplot as plt(train_image, train_lable), (test_image, test_label) = tf.keras.datasets.fashion_mnist.load_data()trai...原创 2020-04-09 16:05:44 · 206 阅读 · 0 评论 -
softmax 独热编码
import tensorflow as tfimport numpy as npimport pandas as pdimport matplotlib.pyplot as plt# fashion_mnist = tf.keras.datasets.fashion_mnist.load_data()(train_image, train_lable), (test_image, ...原创 2020-04-09 16:04:40 · 335 阅读 · 0 评论 -
分类问题的时候用交叉熵损失函数会更有效
# 分类问题的时候用交叉熵损失函数会更有效# binary_crossentropy 来计算二元交叉熵import tensorflow as tfimport numpy as npimport pandas as pdimport matplotlib.pyplot as pltdata = pd.read_csv('credit-a.csv', header=None)# ...原创 2020-04-09 16:03:56 · 415 阅读 · 0 评论 -
初探 TensorFlow
import tensorflow as tfimport pandas as pdimport matplotlib.pyplot as pltdata = pd.read_csv('TensorFlow学历与收入预测.csv')# print(data)plt.scatter(data.Education, data.Income)# plt.show()# 单变量线性回归...原创 2020-04-08 14:23:34 · 165 阅读 · 0 评论 -
day 9.2 逻辑回归-案例-评分卡制作
import numpy as npimport pandas as pdpd.set_option('display.max_columns', None)from sklearn.linear_model import LogisticRegression as LRdata = pd.read_csv('评分卡模型数据.csv')# print(data.head())# ...原创 2020-04-07 16:53:33 · 385 阅读 · 0 评论 -
day 9.1 逻辑回归-二元回归与多元回归
# todo 重要参数 solver & multi_class# multi_class 输入告知模型,我们要处理分类问题的模型# 1. 输入 'ovr' 处理二分类,或者让模型使用‘一对多’的形式来处理多分类问题# 2.'multinomial' 处理多分类,这种输入在参数solverwe是linlinear时不可用# 3.'auto' ...原创 2020-04-07 16:52:43 · 2036 阅读 · 0 评论 -
day 9.0 逻辑回归- 梯度下降
# max_iter 控制步长# max_iter越大,步长越小,迭代次数大,模型时间长,反之from sklearn.linear_model import LogisticRegression as LRfrom sklearn.datasets import load_breast_cancerimport numpy as npimport matplotlib.pyplot ...原创 2020-04-07 16:51:37 · 172 阅读 · 0 评论 -
day 8.6 逻辑回归-特征过程
# 方法1.自己分析# PCA 和 SVD 一般用不上# 方法2. 统计方法可以使用,但没必要# todo: 高效的嵌入法from sklearn.linear_model import LogisticRegression as LRfrom sklearn.datasets import load_breast_cancerimport numpy as npimport...原创 2020-04-07 09:05:48 · 212 阅读 · 0 评论 -
day 8.5 逻辑回归-正则化参数
# linear_model.LogisticRegression 逻辑回归回归分类器(又叫logit回归,最大熵分类器)# linear_model.LogisticRegressionCV 带交叉验证的逻辑回归分类器# linear_model.logistic_regression_path 计算Logistic回归模型以获得正则化参数的列表# linear_model....原创 2020-04-07 09:04:42 · 1080 阅读 · 0 评论 -
day 7 特征选择
import pandas as pdimport numpy as npdata = pd.read_csv("digit recognizor.csv")# print(data.head())x = data.iloc[:, 1:]y = data.iloc[:, 0]# print(x.shape) ##(42000, 784)"""数据量相对夸张,如果使用支持向量机...原创 2020-04-01 14:38:11 · 239 阅读 · 0 评论 -
day 6 处理连续型数据
import pandas as pdfrom sklearn.impute import SimpleImputerdata = pd.read_csv('缺失预处理数据22222.csv', index_col=0) # 把第0列作为索引data.loc[:, "Age"] = SimpleImputer(strategy="median").fit_transform(data....原创 2020-03-31 14:45:41 · 248 阅读 · 0 评论 -
day 6 缺失值处理
import pandas as pdfrom sklearn.impute import SimpleImputer # 专门补缺的类from sklearn.preprocessing import LabelEncoder # 标签专用,能够将分类转换为分类数值data = pd.read_csv('缺失预处理数据22222.csv', index_col=0) # 把第0列...原创 2020-03-31 11:11:27 · 223 阅读 · 0 评论 -
day6 数据归一化
# 数据归一化from sklearn.preprocessing import MinMaxScalerimport pandas as pddata = [[-1, 2], [-0.5, 6], [0, 10], [1, 18]]# todo: 实现归一化scaler = MinMaxScaler() # 实例化# scaler = scaler.fit(data) # ...原创 2020-03-31 10:14:35 · 204 阅读 · 0 评论 -
day 5 泰坦尼克号 随机森林补缺+ 调参
# -*- coding: utf-8 -*-# rfc = RandomForestClassifier(n_estimators=68# ,random_state=90# ,criterion="gini"# ...原创 2020-03-31 08:45:49 · 395 阅读 · 0 评论 -
day 5 随机森林在乳腺癌数据上面的调参
from sklearn.datasets import load_breast_cancerfrom sklearn.ensemble import RandomForestClassifierfrom sklearn.model_selection import GridSearchCVfrom sklearn.model_selection import cross_val_scor...原创 2020-03-31 08:44:40 · 199 阅读 · 0 评论 -
day 4 随机森林 回归填补缺失值
from pprint import pprintfrom sklearn.ensemble import RandomForestRegressor # 随机森林回归器from sklearn.impute import SimpleImputer # 用来填补缺失值的import numpy as npimport pandas as pdimport matplotlib....原创 2020-03-27 14:16:43 · 963 阅读 · 0 评论 -
day3 机器学习 sklearn学习 集成算法-随机森林
# todo: 集成算法模块 集成学习 ensemble# 决策树非常容易 过拟合:在训练集上表现优秀,却在测试集上表现糟糕,一般用剪枝# 目前最受欢迎的集成算法GBDT# todo:三类集成算法:# ·装袋法(Bagging):构建多个相互独立的评估器,然后对其预测进行平均或多数表决原则来决定集成评估器的结果。装袋法的代表模型就是随机森林# ·提升法(Boosting) :基评...原创 2020-03-26 11:49:42 · 248 阅读 · 0 评论 -
决策树完成 ---泰坦尼克号生存者预测
import pandas as pdfrom sklearn.tree import DecisionTreeClassifierimport matplotlib.pyplot as pltfrom sklearn.model_selection import GridSearchCV, train_test_split, cross_val_score # 测试集训练集## da...原创 2020-03-25 15:58:49 · 298 阅读 · 0 评论 -
机器学习 sklearn学习 第二天 回归树
from sklearn.datasets import load_boston # 著名波士顿房价数据from sklearn.model_selection import cross_val_score # 交叉验证from sklearn.tree import DecisionTreeRegressor# todo:# 几乎所有参数,属性和接口都和分类树一模一样# 参数#...原创 2020-03-25 10:31:02 · 196 阅读 · 0 评论 -
机器学习 sklearn学习 第一天-决策树 分类树
from pprint import pprintfrom sklearn import treefrom sklearn.datasets import load_wine # 自带数据库,可以导入知名数据from sklearn.model_selection import train_test_split # 测试集训练集import graphvizimport pand...原创 2020-03-24 14:46:30 · 416 阅读 · 0 评论