自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(16)
  • 收藏
  • 关注

原创 python与wind和excel联动,调用wind接口【附源码】

python与wind和excel联动

2022-09-20 16:31:01 1717

原创 VBA 操作案例

Option ExplicitPrivate Sub Workbook_Open() Dim wb_model As Workbook Dim wb_factor As Workbook Dim wb_asset As Workbook Dim wb_guzhi As Workbook Dim model_sht As Worksheet Dim factor_sht As Worksheet Dim sht Dim asset_sht As

2021-10-15 19:37:34 351

原创 机器学习系列——回归算法(线性回归、岭回归)

一、回归的定义

2021-08-31 17:01:19 1118

原创 机器学习系列文章——算法的实现(knn,朴素贝叶斯,决策树,模型评估)

一、数据集划分在机器学习模型中,我们不可能将所有数据都用来训练,这样模型的效果得不到验证。所以我们会将数据划分为训练集和测试集,训练集和测试集划分的比例由自己制定,通常是按照训练集:测试集 = 3:1的比例,即testsize=0.25。 其中,训练集是用来构建模型,测试数据用来检验模型是否有效。数据集划分API:sklearn.model_selection.train_test_split二、skearn自带数据集获取sklearn中自带了供我们学习参考的数据集,其API如下:import s

2021-08-20 15:17:53 1311

原创 机器学习系列文章——特征的处理与选择(归一化、标准化、降维、PCA)

一、特征处理特征处理是通过特定的统计方法,将数据转化成算法要求的数据。其API为sklearn.preprocessing。先来看一组数据:第一组中的特征1 相比于特征2而言大了几十倍,在正常处理时这些点即可视为异常点,影响统计结果分析。采用特征处理后转变为右侧的数据,可以更加方便的处理而不会产生异常值。常见的处理方法如下:数据类型处理方法数值型数据归一化、标准化、缺失值类别型数据one hot编码时间型数据时间的切分( 一)归一化归一化是通过对原始数

2021-08-16 10:45:58 6254

原创 机器学习系列文章(chapter two)——数据特征分析处理

2021-08-10 17:05:18 855 1

原创 机器学习系列文章(chapter one)—— 机器学习介绍

一、 机器学习简介机器学习是从数据中自动分析获得规律(模型),并利用规律对未知数据进行预测的一种方法。比如淘宝的用户心仪产品推荐、AlphaGo下围棋、智能搜索推荐、智能客服等,都用到了机器学习的算法。未来智慧城市、智慧医疗都需要机器学习来极大程度地解放生产力,所以学习机器学习算法是大势所趋、也顺应了国家未来的发展战略需要。二、机器学习应用场景机器学习现阶段应用场景主要分为四类:- 自然语言处理:如智能识别文本内容,将文本分类等。- 无人驾驶:机器学习道路行驶规则,识别实时路况并做出反应等。-

2021-08-10 15:49:14 182

原创 pandas 时间序列应用详解及案例

一、为什么要学习pandas中的时间序列不管在什么行业中,时间序列都是很重要的一种数据形式,很多统计数据也都和时间序列有非常重要的联系,在pandas中处理时间序列也是非常简单的。(一)生成一段时间范围,返回为<class ‘pandas.core.indexes.datetimes.DatetimeIndex’>类型数据import pandas as pdpd.date_range(start=None,end=None,periods=None,freq='D')在dataf

2021-08-05 23:05:37 846 1

原创 DataFrame 分组聚合详解及案例

一、基本操作介绍(一)join:默认情况下是吧行索引相同的数据合并到一起#创建两个dataframe t1=pd.DataFrame(np.random.randn(3,4),index=list("ABC"),columns=list("wxyz"))t2=pd.DataFrame(np.random.randn(2,6),index=list("AB"),columns=list("EFGHIJ"))t1,t2# 默认how=left 即以t1的索引为主键,将t2的值加进去,没有的以nan

2021-08-04 17:19:19 3833 2

原创 用python绘图——matplotlib详解

一、matplotlib介绍matplotlib是python从matlab继承的绘图库,可以满足大部分的日常使用,是目前最流行的底层绘图库。二、matplotlib的使用(一)导入模块【中文显示】显示中文方面mac和windows根据自己电脑系统选一个即可import matplotlib.pyplot as plt# 显示中文(mac)from matplotlib.font_manager import FontManagerfm = FontManager()mat_fonts =

2021-07-29 15:14:06 1569

原创 数据结构与算法 二叉树

二叉树

2021-07-28 10:04:53 206

原创 数据结构与算法 排序与搜索(二)

一、 排序(一)希尔排序希尔排序是把记录按下标的一定增量分组,对每组使用直接插入排序算法排序;随着增量逐渐减少,每组包含的关键词越来越多,当增量减至1时,整个文件恰被分成一组,算法便终止。希尔排序的基本思想是:将数组列在一个表中并对列分别进行插入排序,重复这过程,不过每次用更长的列(步长更长了,列数更少了)来进行。最后整个表就只有一列了。将数组转换至表是为了更好地理解这算法,算法本身还是使用数组进行排序。其代码实现如下:def shell_sort(alist): """希尔排序"""

2021-07-23 16:18:42 104

原创 数据结构与算法 排序与搜索(一)

排序排序是指将数据按照一定顺序排列起来的一种算法。以下逐个介绍。一、冒泡排序冒泡排序是将列表之间的元素依次两两比较,大的调换位置至右边。第一次两两比较时一定会将最大的元素放在最右边,故第二次遍历只需遍历n-1次。def bubble_sort(urlist): #所需遍历的次数 for j in range(len(urlist) - 1, 0, -1): #两两互相比较 for i in range(j): if urlist[i] &

2021-07-22 16:59:42 102

原创 数据结构与算法 栈与队列

栈,遵循后入先出原则,即后进栈的元素先出栈。其代码实现如下:class stack(object): """栈""" def __init__(self): self.items = [] def is_empty(self):#判断是否为空栈 return self.items == [] def push(self, item):#入栈 self.items.append(item) def pop(sel

2021-07-22 08:47:49 98

原创 数据结构与算法 链表

一、链表的概念链表是一种顺序表,其特点是在每一个节点里存放下一个节点的位置信息,用指针指向下一个节点,从而实现灵活存取。链表单链表的每个节点包含两个域,信息域和链接域,链接域指向链表的下一个节点,最后一个节点的链接域指向空值。1.elem 用来存放具体数据2.链接域next用来存放下一个节点的位置3.变量p指向链表的首节点,从p出发能找到表中的任意一个节点二、链表的代码实现(一)创建节点类class SingleNode(object): """单链表的节点""" de

2021-07-21 15:28:54 176 1

原创 数据结构与算法 引入篇

引入问题如果a+b+c=1000,and a2+b2_=c^2,求a b c (为整数)枚举法:基本思想:挨个举例,挨个往里套。是最简单,效率最低的思想。此处运用time模块来计算程序运行的时间import timestart_time=time.time()for a in range(1001): for b in range(1001): for c in range(1001): if a+b+c==1000 and a**2+b**2==

2021-07-20 13:44:51 238

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除