自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(14)
  • 收藏
  • 关注

原创 python连接oracle数据库

1、确保python、oracle 客户端、cx_Oracle位数一致(1)python确认64位(2)下载64位的Instant Client(3)我是直接在python路径下,安装了最新版的cx_Oracle2、 解压Instant Client到E:\Instant Client,并将bin下所有dll文件复制到python安装路径下的site-packages文件夹下查看python安装路径:3、成功连接字符串格式:cx_Oracle.c...

2021-10-08 16:47:49 532

原创 PCA主成分分析

1、PCA算法:PCA过程的实现:(1)numpy可以模拟 (2)sklearn可以实现1.1、使用numpy模拟PCA过程import numpy as npA=np.array([[3,2000], [2,3000], [4,5000], [5,8000], [1,2000]],dtype='float')#使用numpy模拟PCA过程#数据降维#1、数据归一化mean=n...

2021-09-28 14:44:02 1393

原创 贝叶斯算法进行文档分类

from time import timefrom sklearn.datasets import load_filesprint("加载训练集 ...")t=time()news_train=load_files(r'C:\Users\EDZ\PycharmProjects\379\train')#读入内存print("统计:文档数:{0} ,分类数:{1} ".format(len(news_train.data),len(news_train.target_names)))print(.

2021-09-28 10:25:42 386

原创 SVM向量机——预测乳腺癌

1、画学习曲线import numpy as npimport matplotlib.pyplot as pltfrom sklearn.model_selection import learning_curveplt.rcParams['font.sans-serif'] = ['SimHei']#显示中文def plot_learning_curve(estimator, title, X, y, ylim=None, cv=None, .

2021-09-23 16:31:55 2029

原创 决策树——预测泰坦尼克号幸存者

数据集解释:• Passengerld :乘客ID ,这是个顺序编号, 唯一地标识 乘客。这个特征和幸存与否无关,我们不使用这个特征• Survived : 表示幸存者表示遇难。这个是我们的标注数据。• Pclass :仓位等级,是很重要的特征。看过电影读者都知道,高仓位等级的乘客更快地到达甲板,从而更容易获救。• Name :乘客名字,这个特征和幸存与否无关,我们会丢弃这个特征。• Sex :乘客性别, 过电影的读者都知道,由于救生艇数量不够,船民让妇女和儿童先上救生艇。所 以这也是个很重..

2021-09-17 15:17:09 4181

原创 逻辑回归算法——乳腺癌检测

这个数据集总共从病灶造影图片中提取 以下 10 个关键属性。• radius 半径 即病灶中心点离边界的平均距离• texture 纹理,灰度值的标准偏差。• perimeter 周长 即病灶的大小• area 积,也是反映病灶大小一个指标。• smoothness 平滑度 ,即半径的变化幅度。• actness :密实度,周长的平方除以面积的商 再减1• concavity 凹度,凹陷部分轮廓的严重程度• concave points 凹点 凹陷轮廓的数量。• symmetry ...

2021-09-16 13:30:26 2277

原创 安装prophet

1、创建一个新的环境按照官网的做法,创建一个新的python环境激活这个环境。2、安装C++的编译工具3、安装依赖库4、安装pystan居然安装好了,我的妈呀,这就是心动的感觉。5、安装fbprophet安装成功了。...

2021-09-15 10:52:26 1208

转载 关于销量预测方法和采购备货问题

关于销量预测方法和采购备货问题在所有的预测问题中,最不靠谱的就是销量预测. --master苏1. 前言销量预测是一个古老的问题,进入市场经济以来这个问题变得更加迫切,也得到更多人的关注,特别是进入大数据时代后,随着算法模型被不断提出来,收集数据的成本逐步降低,收集到的数据越来越多,这个问题变得比以前有趣,同时也被寄予更加迫切且不合理的期望,也比以前更难,不仅仅是数据变多了、模型复杂了,而是社会变得复杂了,亚文化兴起,细分领域竞争也逐渐变得激烈,而这些都是要被考虑到预测因素中,你说,在一个不能聚

2021-09-13 15:49:50 4155

原创 线性回归——预测波士顿房价

用线性回归算法拟合正弦函数(加入多项式)#用线性回归算法拟合正弦函数#首先,生成 200 个在[-2pai,2pai] 区间内的正弦函数上的点 并且给这些点加上一些随机的噪声。import numpy as npn_dots=200X=np.linspace(-2*np.pi,2*np.pi,n_dots)Y=np.sin(X)+0.2*np.random.rand(n_dots)-0.1#X.shape#(200,)#Y.shape#(200,)X=X.reshape(-1,1)#(

2021-09-10 10:21:31 1187

原创 时间序列预测的7种方法

import pandas as pd#取数#df=pd.read_csv('jetrail.csv')#print(df.head())''' ID Datetime Count0 0 25-08-2012 00:00 81 1 25-08-2012 01:00 22 2 25-08-2012 02:00 63 3 25-08-2012 03:00 24 4 25-08-2012 04:0.

2021-09-08 13:44:20 11246

原创 k-近邻算法

from sklearn.datasets import make_blobsfrom sklearn.neighbors import KNeighborsClassifier,RadiusNeighborsClassifierfrom sklearn.neighbors import KNeighborsRegressorfrom sklearn.model_selection import train_test_splitfrom sklearn.model_selection im.

2021-09-05 11:23:14 309

原创 画学习曲线的方法

import matplotlib.pyplot as pltimport numpy as npimport pandas as pdfrom sklearn.model_selection import ShuffleSplit from sklearn.model_selection import learning_curvefrom sklearn.neighbors import KNeighborsClassifier#加载数据data=pd.read_csv(r"D:\De.

2021-09-02 11:55:55 2021 1

转载 机器学习算法模型速查表

2021-08-31 14:13:52 378

原创 机器学习-手写数字识别1

用到的库:from sklearn import datasetsfrom sklearn.model_selection import train_test_splitfrom sklearn import svmfrom sklearn.externals import joblib1、数据的采集与标记from sklearn import datasetsdigits=datasets.load_dig...

2021-08-31 14:01:56 368

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除