
AI
记录机器学习实例
Python代码写的很糊,各种算法初次入手,一切从零开始。
sunyutian1998
这个作者很懒,什么都没留下…
展开
-
手写数字识别 手动实现+基于Pytorch实现
利用sklearn中的数据集手动实现:import numpy as npfrom sklearn.datasets import load_digitsfrom sklearn.preprocessing import LabelBinarizerfrom sklearn.model_selection import train_test_splitimport warningsimport randomwarnings.filterwarnings('ignore')random.s原创 2020-12-02 18:16:46 · 324 阅读 · 0 评论 -
使用感知机对随机生成数据集进行分类 (线性可分)
学习参考《统计学习方法》现存疑惑:对于书中解释需进一步理解代码如下:import numpy as npfrom matplotlib import pyplot as pltnp.random.seed(0)X=np.r_[np.random.randn(20,2)-[3,3],np.random.randn(20,2)+[3,3]]Y=20*[-1]+20*[1]w,b=[0.0,0.0],0.0step=0.01while True: p=-1.原创 2020-07-20 18:21:48 · 2023 阅读 · 0 评论 -
使用SVM对随机生成数据集进行分类 (线性可分 硬间隔)
具体数学原理参考《统计学习方法》在学习过程中有疑惑如下:一直想不明白为什么式7.11中的分子没有用并且可以被当作常数下面的解释是当w与b同比例变换时,函数间隔(即分子)亦会同比例变换。的确是这样,自己纸上写一下就好。但是为什么w和b一定要同比例变换?如果不同比例的话上述结论就不成立了啊?后来自己想到的解释是:我们最终要求的参数是w和b,而w和b组合在一起就代表了一个平面。对于整个问题而言,我们要找的就是一个可以是几何间隔最大的超平面,可以大体表示为y=f(x)的形式,其中x代原创 2020-07-15 17:47:00 · 2848 阅读 · 0 评论 -
使用K近邻对iris数据集进行分类
听了好几年的K近邻算法 今天终于接触到了原理很简单 讲样本映射为多维空间中的点无标签新样本 由空间中与其最近的K个点中数量最多的标签来定义以下为暴力实现 高效算法留坑from sklearn import datasetsdef cmp(elem): return elem[0]iris=datasets.load_iris()data=iris.datatarget=iris.targetnum_data,num_feature=data.shapenum_ta原创 2020-07-13 10:03:03 · 1677 阅读 · 0 评论 -
梯度下降&线性回归
import csvimport random as rdimport matplotlib.pyplot as pltInf=1e9data=csv.reader(open("dataII.csv","r"))L=list(data);X=[];Y=[]for row in L: X.append(float(row[0]));Y.append(float(row[1]))N=len(X);step=0.0001#a=rd.uniform(-Inf,Inf...原创 2020-05-31 12:37:00 · 350 阅读 · 2 评论 -
最小二乘法&线性回归
参考https://b23.tv/aUuSF7import pandas as pdimport numpy as npimport random as rdimport matplotlib.pyplot as pltfrom sklearn.linear_model import LinearRegressiondata=pd.read_excel("data.xlsx")features=data["X"].values.reshape(-1,1)target=data.原创 2020-05-27 17:08:31 · 292 阅读 · 0 评论 -
使用朴素贝叶斯对iris数据集进行分类
贝叶斯分类是数学性较强的分类方法,在处理多属性问题的分类时,主要用到下面两个公式:第二个公式之所以成立,是因为在贝叶斯分类中进行了各属性均与分类标签独立的假设。即X与Ci独立,则有:,,import randomimport numpy as npfrom math import efrom math import powfrom sklearn.datasets import load_irisiris=load_iris()n_tot,n_attr=iri..原创 2020-05-26 10:17:12 · 7457 阅读 · 2 评论