机器学习笔记

本文探讨了Python中使用matplotlib库进行数据可视化时遇到的问题及解决方法,并介绍了矢量化编程的概念及其在NumPy库中的应用。文中还详细列举了NumPy的基础操作,包括初始化数组、基本算术运算及向量和矩阵的处理。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

CHAPER 1

1.1 mytest1.py中

plt.scatter(dataMat[0],dataMat[1],c='red',marker='o')

会有错误,是因为scatter函数对输入数据有要求,需要时一维的数组,dataMat[0]是矩阵类型,改为

plt.scatter(array(dataMat[0]),array(dataMat[1]),c='red',marker='o')

1.2 矢量化编程

个人认为就是代码实现的便利性,传统语言针对标量,矩阵的运算本来是通过数组和循环进行,现在可以直接按照公式进行。

其中最主要的库就是NumPy,初始化如下:

import munpy as np
my_zeros = np.zeros([3,5])
my_ones = np.ones([3,5])
my_rand = np.random.rand(3,4)
me_eye = np.eye(3)

计算:

加减:+-
数乘:*
求所有元素和:sum()
对应每个元素乘积:multiply(,)
幂:power(,)
转置:transpose()
行列数:[m,n]=shape()
按行取:my_matrix[0]
按列取:my_matrix.T[0]

1.3 数学基础

相似性的度量——向量的距离

距离公式:

闵可夫斯基距离(Minkowski Distance),其实是一组距离的定义:
d_{12}=\sqrt[p]{\sum_{k=1}^{n}\left ( x_{1k}-x_{2k} \right )^{p}}  p=1,曼哈顿距离;p=2,欧氏距离;p趋于无穷,切比雪夫距离。

 

d_{12}=max_{i}\left ( \left | x_{1i}-x_{2i} \right | \right )——切比雪夫距离。

夹角余弦——衡量两个向量方向的差异。

汉明距离——两个等长字符串不等的个数。

杰卡德相似系数——两个集合交集在并集中的比例,衡量两个集合的相似度,对应有杰卡德距离,1减相似系数,1-J

贝叶斯公式P(B|A)=P(A|B)P(B)/P(A).

向量×矩阵:线性空间转换

矩阵乘法:向量组空间变换

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值