
机器学习
机器学习
程序员的诗与远方
这个作者很懒,什么都没留下…
展开
-
求最长公共子串长度与最长公共子串问题/求最长公共子序列长度与最长公共子序列问题
import numpy as npstr1 = 'abaccb'str2 = 'aaccab'tmp_str1 = str1tmp_str2 = str2str1 = '0' + str1str2 = '0' + str2len1 = len(str1)len2 = len(str2)dp = np.zeros((len1, len2), dtype=np.int)for i in range(1, len1): for j in range(1, len2):原创 2021-03-10 15:04:56 · 187 阅读 · 0 评论 -
不平衡数据集的处理
所谓的不平衡数据集指的是数据集各个类别的样本量极不均衡。以二分类问题为例,假设正类的样本数量远大于负类的样本数量,通常情况下通常情况下把多数类样本的比例接近100:1这种情况下的数据称为不平衡数据。不平衡数据的学习即需要在分布不均匀的数据集中学习到有用的信息。不平衡数据集的处理方法主要分为两个方面:1、从数据的角度出发,主要方法为采样,分为欠采样和过采样以及对应的一些改进方法。2、从算法的角度出发,考虑不同误分类情况代价的差异性对算法进行优化,主要是基于代价敏感学习算法(Cost-Sensitive原创 2021-02-21 20:14:16 · 786 阅读 · 0 评论 -
机器学习-决策树的快速入门案例
机器学习-决策树的快速入门案例案例:利用决策树分析,数据集利用sklearn 中的红酒数据集,进行红酒数据集的分类操作代码实现:from sklearn.tree import DecisionTreeClassifierfrom sklearn.model_selection import train_test_split, cross_val_scoreimport matplotlib.pyplot as pltimport numpy as npimport pandas as pd原创 2020-05-12 21:59:28 · 186 阅读 · 0 评论