- 博客(12)
- 收藏
- 关注
原创 深度学习简介
假设做手写数字辨识,现在有一张图片和对应的标签。让图片通过神经网络后,得到一个输出y。计算y和之间的Cross Entropy,然后用梯度下降算法不断地调整参数,使得Cross Entropy越来越小。在整个数据集中,我们有很多样本,通过神经网络可以得到一个预测值y输出,我们把所有的预测值和真实标签之间的Cross Entropy加起来,得到一个总loss值。然后,我们在函数集中找到一个使得总loss最小的函数。
2025-04-18 20:52:12
212
原创 浅层神经网络
在这样的情况下,多个隐藏元将失去意义。如果你使用的是sigmoid或者是tanh函数,初始化参数w值过大,就有可能在一开始训练时落在激活函数很大的区域,导致激活函数接近饱和,梯度下降缓慢,减缓学习速度。Leaky Relu和Relu函数的优点是:对于大部分的z空间,激活函数的导数不会为0,神经网络的学习速度通常比tanh函数或者sigmoid函数快得多。有个激活函数几乎总比sigmoid函数表现更好,比如tanh函数(双曲正切函数),因为函数的输出介于-1和1之间,激活函数的平均值更接近与0。
2025-04-18 12:36:55
545
原创 监督学习:分类
线性回归不仅可以预测0和1的值,它还可以预测在0和1之间的数字,甚至大于1或小于0的数字。这个特定的代价函数是在统计学中使用一种最大似然估计的统计原理推导出来的,这是统计学中,关于如何高效找到不同模型参数的一个想法。假设下图是你的数据集,输入特征x是房子大小,y是房价,你可以使用线性函数拟合这组数据,但可能并不是一个很好的模型,因为没有很好的拟合数据。(2)学习算法有一个非常强烈的偏见,认为房价完全和面积成线性关系,尽管数据可能与此相反,导致它拟合了一条与数据吻合不佳的直线,从而导致数据欠拟合。
2025-04-14 00:37:50
1027
原创 深度学习简介
我们从预测房价这个例子开始。假设你有一个数据集,它是6个房子的数据,你知道房子面积以及对应的房价。我们想要用一个函数,根据房子面积预测房价。我们可以用一条直线来拟合数据,但你可能会说,价格不可能是负数,如果用单纯的直线来拟合数据,可能会出现负数的情况,所以我们可以把直线折一下,使其在这里归零。你可以把刚才根据房价拟合出来的函数当做一个很简单的神经网络。房子的大小x作为对神经网络的输入,通过神经元输出预测房价:一个单一神经元,是非常小的网络;
2025-04-13 13:33:35
332
原创 多变量线性回归
但是现在,我们不仅有房屋面积作为预测房价的一个特征,我们还知道房间数、楼层数以及房子的年代等等,这给了我们更多的信息用来预测房价,模型用(x1,x2,x3,x4)来表示特征,y表示预测的房价。这里的x轴表示梯度下降算法的迭代次数,随着梯度下降算法的运行,可能会得到这样一条曲线,这条曲线显示的是:梯度下降的每步迭代后,代价函数的值。值,比如0.001 ,0.003, 0.01,0.03, 0.1,0.3,1 ,然后对于这些不同的。n -------- 特征量的数目,在这个例子中,n=4。
2025-04-08 23:57:09
900
原创 单变量线性回归
梯度下降有一个有趣的特点:第一次运行梯度下降法时,我们是从某个点开始的,如果我们从初始点右边一点的位置开始 ,使用梯度下降算法,重复上述的步骤,梯度下降算法会将你带到右边的第二个局部最优处,这是与之前完全不同的局部最优点。上面的例子,我们只有参数w,绘制出来的图形是J(w)的函数,但是现在我们有参数w和b,因此代价函数图形变得复杂了。根据为这些参数选择不同的值,会得到不同的直线,我们想找到w和b的值,使得这条直线能很好的拟合训练数据,为了衡量选择的w和b的值对训练数据的拟合程度,用一个代价函数。
2025-04-08 15:10:59
813
原创 监督学习与无监督学习
中的应用,许多公司拥有庞大的信息数据库,对于一个客户数据集,你能否自动找出不同的市场细分,并自动将你的客户分到不同的细分市场,从而能够自动高效地在不同的细分市场中进行销售,这也是无监督学习,因为我们有全部的客户数据,但我们预先并不知道有哪些细分市场,而且对于我们数据集中的客户,我们也不能预先知道谁属于细分市场1,谁又属于细分2等等,但我们必须让算法自己从数据中发现这一切。在这个例子中,我们只使用了一个特征或者属性,即肿瘤的大小,来预测肿瘤是良性的还是恶性的,在其他机器学习问题中,我们会有多个特征。
2025-04-07 14:36:44
719
原创 解决Kaggle新用户注册的Captcha must be filled out问题
今天,在注册时kaggle时,填写完了信息点击Next,弹出了Captcha must be filled out的红字。现附上解决方法。 或者
2025-01-14 18:23:59
1059
2
原创 深度学习----线性表示代码
一个人有外貌、性格、财富、内涵这四个维度的分数,通过这四个维度的分数,可以得到一个人的恋爱次数。假设这四个维度的权重w分别为(801,2,2,4),偏置b=1.1。
2025-01-10 21:56:32
176
原创 深度学习——多层神经网络
如果全等的传输信息,即从外界获取到5个信息,经过神经元的传输后,大脑也接收到5个信息,那么串联的神经元似乎只有传递的作用,,那么一根和多根似乎没有区别了。对于AI,也是这样的。我们都知道,人的神经元不是只有一条的,是有多条的,也就是说,多条神经元接收到相同的外部信息,再把信息传输给大脑,让大脑做出决断。但是,这与神经网络图的表示方式是一模一样的,只不过,换成了矩阵的形式。从图中,我们可以清楚的看到预测函数和真实函数是贴着的,也就是说,当真实函数是线性函数时,即使模型没有激活函数,它也能够准确的预测。
2025-01-09 20:20:52
1520
原创 深度学习.
定义一个合适的损失函数(loss函数),用来衡量定义的函数f'和真实函数f之间的差值有多大。即L=(1.9+2.9+4.1+5.3+6.2+6.5) / 6 = 4.48 ,这个Loss值就衡量了w0=3,b0=2这组数字选的好不好,显然数字太大了,选取的不好。值得注意的是:这样的线性公式只能画出一条直线,即它没办法只画一条直线,把下图的三角形和正方形分开,而它又无法画出下图的圈。x通过函数f映射到y。有的时候需要多个模态(模态:例如有图有数据的任务)的数据,比如图片,文字,声音都是不同的模态。
2025-01-08 17:36:33
1250
原创 机器学习算法简介
不是认识的人,有垃圾关键词,就是垃圾邮件,没有垃圾关键词,就不是垃圾邮件。如果来了一个新的邮件,按照决策树走一趟,走到叶节点,就可以判断是否是垃圾邮件。这种情况很可能遇到问题,假如没有垃圾关键词的邮件中,有垃圾邮件,这时只能添加其他特征。例如:判断红点是A类还是B类,当邻居数量是3时,有1个A类,2个B类,判断红点是B类;当邻居K=6时,有4个A类,2个B类,判断红点是A类。一般是基于数学,或者统计学的方法,具有很强的可解释性,但准确率不是百分百,且不灵活。朴素贝叶斯的后验,通过结果来推断前面选择。
2025-01-04 23:32:05
178
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人