- 博客(16)
- 收藏
- 关注
原创 VBA 操作案例
Option ExplicitPrivate Sub Workbook_Open() Dim wb_model As Workbook Dim wb_factor As Workbook Dim wb_asset As Workbook Dim wb_guzhi As Workbook Dim model_sht As Worksheet Dim factor_sht As Worksheet Dim sht Dim asset_sht As
2021-10-15 19:37:34
351
原创 机器学习系列文章——算法的实现(knn,朴素贝叶斯,决策树,模型评估)
一、数据集划分在机器学习模型中,我们不可能将所有数据都用来训练,这样模型的效果得不到验证。所以我们会将数据划分为训练集和测试集,训练集和测试集划分的比例由自己制定,通常是按照训练集:测试集 = 3:1的比例,即testsize=0.25。 其中,训练集是用来构建模型,测试数据用来检验模型是否有效。数据集划分API:sklearn.model_selection.train_test_split二、skearn自带数据集获取sklearn中自带了供我们学习参考的数据集,其API如下:import s
2021-08-20 15:17:53
1311
原创 机器学习系列文章——特征的处理与选择(归一化、标准化、降维、PCA)
一、特征处理特征处理是通过特定的统计方法,将数据转化成算法要求的数据。其API为sklearn.preprocessing。先来看一组数据:第一组中的特征1 相比于特征2而言大了几十倍,在正常处理时这些点即可视为异常点,影响统计结果分析。采用特征处理后转变为右侧的数据,可以更加方便的处理而不会产生异常值。常见的处理方法如下:数据类型处理方法数值型数据归一化、标准化、缺失值类别型数据one hot编码时间型数据时间的切分( 一)归一化归一化是通过对原始数
2021-08-16 10:45:58
6254
原创 机器学习系列文章(chapter one)—— 机器学习介绍
一、 机器学习简介机器学习是从数据中自动分析获得规律(模型),并利用规律对未知数据进行预测的一种方法。比如淘宝的用户心仪产品推荐、AlphaGo下围棋、智能搜索推荐、智能客服等,都用到了机器学习的算法。未来智慧城市、智慧医疗都需要机器学习来极大程度地解放生产力,所以学习机器学习算法是大势所趋、也顺应了国家未来的发展战略需要。二、机器学习应用场景机器学习现阶段应用场景主要分为四类:- 自然语言处理:如智能识别文本内容,将文本分类等。- 无人驾驶:机器学习道路行驶规则,识别实时路况并做出反应等。-
2021-08-10 15:49:14
182
原创 pandas 时间序列应用详解及案例
一、为什么要学习pandas中的时间序列不管在什么行业中,时间序列都是很重要的一种数据形式,很多统计数据也都和时间序列有非常重要的联系,在pandas中处理时间序列也是非常简单的。(一)生成一段时间范围,返回为<class ‘pandas.core.indexes.datetimes.DatetimeIndex’>类型数据import pandas as pdpd.date_range(start=None,end=None,periods=None,freq='D')在dataf
2021-08-05 23:05:37
846
1
原创 DataFrame 分组聚合详解及案例
一、基本操作介绍(一)join:默认情况下是吧行索引相同的数据合并到一起#创建两个dataframe t1=pd.DataFrame(np.random.randn(3,4),index=list("ABC"),columns=list("wxyz"))t2=pd.DataFrame(np.random.randn(2,6),index=list("AB"),columns=list("EFGHIJ"))t1,t2# 默认how=left 即以t1的索引为主键,将t2的值加进去,没有的以nan
2021-08-04 17:19:19
3833
2
原创 用python绘图——matplotlib详解
一、matplotlib介绍matplotlib是python从matlab继承的绘图库,可以满足大部分的日常使用,是目前最流行的底层绘图库。二、matplotlib的使用(一)导入模块【中文显示】显示中文方面mac和windows根据自己电脑系统选一个即可import matplotlib.pyplot as plt# 显示中文(mac)from matplotlib.font_manager import FontManagerfm = FontManager()mat_fonts =
2021-07-29 15:14:06
1569
原创 数据结构与算法 排序与搜索(二)
一、 排序(一)希尔排序希尔排序是把记录按下标的一定增量分组,对每组使用直接插入排序算法排序;随着增量逐渐减少,每组包含的关键词越来越多,当增量减至1时,整个文件恰被分成一组,算法便终止。希尔排序的基本思想是:将数组列在一个表中并对列分别进行插入排序,重复这过程,不过每次用更长的列(步长更长了,列数更少了)来进行。最后整个表就只有一列了。将数组转换至表是为了更好地理解这算法,算法本身还是使用数组进行排序。其代码实现如下:def shell_sort(alist): """希尔排序"""
2021-07-23 16:18:42
104
原创 数据结构与算法 排序与搜索(一)
排序排序是指将数据按照一定顺序排列起来的一种算法。以下逐个介绍。一、冒泡排序冒泡排序是将列表之间的元素依次两两比较,大的调换位置至右边。第一次两两比较时一定会将最大的元素放在最右边,故第二次遍历只需遍历n-1次。def bubble_sort(urlist): #所需遍历的次数 for j in range(len(urlist) - 1, 0, -1): #两两互相比较 for i in range(j): if urlist[i] &
2021-07-22 16:59:42
102
原创 数据结构与算法 栈与队列
栈,遵循后入先出原则,即后进栈的元素先出栈。其代码实现如下:class stack(object): """栈""" def __init__(self): self.items = [] def is_empty(self):#判断是否为空栈 return self.items == [] def push(self, item):#入栈 self.items.append(item) def pop(sel
2021-07-22 08:47:49
98
原创 数据结构与算法 链表
一、链表的概念链表是一种顺序表,其特点是在每一个节点里存放下一个节点的位置信息,用指针指向下一个节点,从而实现灵活存取。链表单链表的每个节点包含两个域,信息域和链接域,链接域指向链表的下一个节点,最后一个节点的链接域指向空值。1.elem 用来存放具体数据2.链接域next用来存放下一个节点的位置3.变量p指向链表的首节点,从p出发能找到表中的任意一个节点二、链表的代码实现(一)创建节点类class SingleNode(object): """单链表的节点""" de
2021-07-21 15:28:54
176
1
原创 数据结构与算法 引入篇
引入问题如果a+b+c=1000,and a2+b2_=c^2,求a b c (为整数)枚举法:基本思想:挨个举例,挨个往里套。是最简单,效率最低的思想。此处运用time模块来计算程序运行的时间import timestart_time=time.time()for a in range(1001): for b in range(1001): for c in range(1001): if a+b+c==1000 and a**2+b**2==
2021-07-20 13:44:51
238
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人