- 博客(16)
- 收藏
- 关注
原创 概率论基础知识点公式汇总
1 概率论的基本概念1.1 随机事件样本空间SSS:将随机实验所有可能的记过组成的集合称为样本空间。样本点:样本空间的每个结果称为样本点。随机试验、随机事件EEE、基本事件、必然事件、不可能事件、对立事件AA‾A\overline{A}AA、古典概型。1.2 频率与概率频率:在相同的条件下进行nnn次实验,事件AAA发生的次数nAn_AnA称为事件AAA发生的频数。nAn\frac{n_A}{n}nnA称为事件AAA发生的频率。概率:EEE是随机试验,SSS是样本空间。P(A)P(
2024-12-21 17:12:29
2968
原创 概率论基础
事件:事件是样本点的集合。A0A=0A0表示事件A不含任何样本点,即A是不可能事件。A0A=0A0是一个代数表达式而不是算术表达式,0在这里是一个符号。样本空间中一切不属于事件A的点所构成的事件称为A的补事件。或称非事件。并以ACA^CAC记之,SC0S^C=0SC0事件A、B、C的交,用A∩B∩CA∩B∩C表示,并用A∪B∪CA∪B∪C表示事件的并A⊂BA\subset BA⊂B。
2024-12-19 11:04:02
863
原创 数学方法(方向导数,向量微分,一元最优化)
方向导数偏导数给出了当 x 沿着某坐标轴(比如 x1 )变动时,函数y=f(x)y = f(x)y=f(x)变化的速率。然而偏导数并不能像二维函数一样表示x→yx \to yx→y的变化速率,这里就引入了偏导数。有时我们想知道当x沿着任意方向变化时,函数f(x)f(x)f(x)的变化速率任意给定X∗(x1∗,x2∗,x3∗,…,xn∗)X^*(x_1^*,x_2^*,x_3^*,\dots,x_n^*)X∗(x1∗,x2∗,x3∗,…,xn∗),考虑f(X)f(X)f(X)在X∗X^*X∗
2024-11-04 18:37:05
703
原创 线性回归方法
对每一个x求导并且最终组成一个矩阵。求导,导函数为0时取得极值,也就是最小值。标准方程法是直接将所有回归参数算出来。都是已知的值,那我们直接将代价函数对。仔细看,这个矩阵就是。
2024-10-06 16:26:22
620
原创 线性回归 :标准方程法的求解 (包含numpy对矩阵加工的代码)
在实践中,将均方误差(MSE)最小化比最小化RMSE更为简单,二者效果相同(因为使函数最小化的值,同样也使其平方根最小)更为概括地说,线性模型就是对输入特征加权求和,再加上一个我们称为偏置项(也称为截距项)的常数,以此进行预测。为了得到使成本函数最小的θ值,有一个闭式解方法——也就是一个直接得出结果的数学方程,即标准方程。生成一个均值为0,标准差为1 ,形状为(a,b)的二维正态分布数组。在机器学习中,向量通常表示为列向量,是有单一列的二维数组。的系数是1,故需要添加一个1的矩阵。
2024-10-06 14:26:26
963
原创 简谐运动相关知识点
为重力,竖直向下,此时方向并不成锐角,与规定的正方向相反。线性回复力 F= -kx 得到物体做简谐运动。(表示刚体到转动中心点的方向向量。这样就可以求出合成之后的振幅和初相了。成锐角,则用右手法则,大拇指方向即为。此时的回复力矩与角位移成正比且反向。方向指向转动中心点)和。这样便求出了力矩的大小。
2024-09-09 19:35:13
1440
1
原创 分类器的性能测试。
第二行表示所有“5”(正类)的图片中:1891张被错误地分为“非5”类别(假负类:错误的猜成负嘞),3530张被正确地分在了“5”这一类别(真正类)这意味着对于每个实例都可以得到一个干净的预测(“干净”的意思是模型预测时使用的数据在其训练期间从未见过)。当它说一张图片是5时,只有72.9%的概率是准确的,并且也只有75.6%的数字5被它检测出来了。这不一定能一直符合你的期望:在某些情况下,你更关心的是精度,而另一些情况下,你可能真正关心的是召回率。正类预测的准确率是一个有意思的指标,它也称为分类器的。
2024-08-31 23:32:39
1020
原创 训练二元分类器
一个好的初始选择是随机梯度下降(SGD)分类器,使用Scikit_Learn 的SGDClassifier类即可。这个分类器的优势是能够有效处理非常大型的数据集。这部分是因为SGD独立处理训练实例,一次一个(这也使得SGD非常适合在线学习),稍后我们将会看到。现在先简化问题,只尝试识别一个数字,比如数字5。那么这个“数字5检测器”就是一个二元分类器的示例,它只能区分两个类别:5和非5。由于X数组里面的数据本身就无规律,因此不需要随机取样。将y中的值转变为[0,255]区间的整数。创建测试集和训练集。
2024-08-31 23:09:51
259
原创 MNIST读取图片
这是一组由美国高中生和人口调查局员工手写的70 000个数字的图片。每张图片都用其代表的数字标记。这个数据集被广为使用,因此也被称作是机器学习领域的“Hello。World”:但凡有人想到了一个新的分类算法,都会想看看在MNIST上的执行结果。因此只要是学习机器学习的人,早晚都要面对MNIST。data键,包含一个数组,每个实例为一行,每个特征为一列。target键,包含一个带有标记的数组。DESCR键,描述数据集。y表示X数据的数字标签。调用显示单个图片的函数。需要明白的是 此处的。
2024-08-28 11:23:54
379
原创 LinearRegression
这段代码首先创建了一个名为datapath的路径对象,该路径指向一个名为"datasets"的文件夹,其中包含一个名为"lifesat"的子文件夹。如果你想要得到一个Series(一维数组),你应该使用单重方括号,但在这里为了保持结果的一致性(即得到一个二维数组,即使它只有一列),使用了双重方括号。这一步被称为模型选择:你选择了一个生活满意度的线性模型,只有一个属性,即人均GDP。函数,将原来的数据框进行更改,在本代码中,改变了行索引和列索引及其值,对于研究更为方便,同时省去了不必要的数据,只留下了。
2024-08-01 16:38:39
1739
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人