大白话5分钟带你走进人工智能-第二节概率基础及高斯分布

本文从数学角度出发,为证明线性回归中损失函数是最小二乘,铺垫了高斯分布这一重要概率密度函数。介绍了高斯分布的发现过程,指出自然界中大量现象由多种随机过程结合,结果趋向正态分布。还讲解了概率论基础,如随机变量、概率密度函数等,下节将推导mse损失函数。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

                                                                         第二节:概率基础及高斯分布

上一节中我们讲述了机器学习的常规套路,以及一些基础的概念,比如损失函数,随机变量等。了解了线性回归中的损失函数是最小二乘,那么本节我们通过数学的角度证明为什么是最小二乘?所以有必要铺垫一个很重要的概率密度函数,高斯分布

既然是分布,它本身就代表一个概率密度函数。只不过高斯分布,拆解开来,就是服从某种特点的概率密度函数。我们知道高斯分布的图形是这样的:

                                                                                                                                              

 

这个图像是高尔顿最早发现的,高尔顿是达尔文的表哥,小的时候做游戏的时候,发现如下图所示的游戏中:

他发现把一堆小球给倒进去之后,最后落在隔板里的越靠中间的落的越多,越靠外面的越来越落的越远,因为钉子是完全随机的,每次倒入小球的过程中,小球每次碰到钉子都会随机地往左走或者往右走,那么小球总共遇到多少层钉子就有多少次往左或者往右的机会,只要这个机会是公平的,最后最多的小球往左的次数跟往右的机会差不多,所以都落到中间的位置。而极少的小球回落到两边,从而他发现了这个高斯分布的函数。

好多自然界中的事物就是服从高斯分布的,比如大学里把女性的教职员工拉过来,在操场站队,按身高五厘米为一个间隔,各自占一个队。你会发现特别矮的和特别高的都怎么样,比较少。身高在中间的最多,也在背后默默地形成了这么一个高斯分布的图形。

思考一下这个背后是为什么?什么决定了一个人的身高?好多种因素,从基因角度就有好多个基因决定。再从你未来生活的饮食习惯有好多种决定你爱不爱运动,又有好多种决定就是是不是好多好多种因素公平的综合的决定了你高还是矮。你想特别倒霉的人基因又矮,吃了又少,又不爱动了,然后父母所有基因都矮的人是不是一定会比较少,因为就相当于在高尔顿钉板这个模型里边,小球一直在往左走,每一个命运的岔路口他都选择了不好的决定,最后造成了它是一个比较特殊的例子。而对于人来说每一个因素决定身高很高这一种可能性也少。所以说若干个随机过程共同决定出一个结果的时候,往往最终的结果的概率密度函数会服从一个高斯分布的形式。 所以我们看简单来说,自然界中大量的现象都是由多种随机过程结合,最后得到一个结果,比如身高,那么根据中心极限定理,不同随机变量满足独立随机相加,就会让结果趋向于正态分布,这个结果就会趋向于正态分布的结果。也就是对于任何一个数学建模来说,我们不知道它服从什么分布的时候往往先拿正态分布来进行尝试。因为正态分布是最常见。

既然是高斯分布式一个概率密度函数,所以自然可以用数学的形式表达出来,具体怎么样得出高斯分布的概率密度函数我们不做推导,仅给出高斯分布的概率密度函数。

                                                                        f(x)=\frac{1}{\sigma \sqrt{2\pi }}e\tfrac{-(x-u)^{2}}{2\sigma ^{2}}

解释:

π就是3.14 ,e是2.7,\sigma是方差,u是均值。

我们理想的概率密度函数,就好比是一个完美的机器,答题机一样,你给我一个题目X,我给你结果概率,给我一个x我给你概率。什么情况下这个机器就算确定好了,只要你确定了均值和标准差,这个机器就算确定好了,也就是在σ和μ这两个东西已知的在均值和标准差都已知的情况下,给一个x就会得到一个唯一的结果,那么均值和方差怎么求?

从名字中就可以窥探一二,假设你收集上来的这堆数据真的服从高斯分布的话,并且你收集上来数量又足够多的情况下,均值就是平均值。\sigma就是方差,如下公式。

                                                                           \frac{1}{m}(y-y(\theta ))^{2}

 

以上实际上我们是我们是讲解了一下概率论的一些基础,咱们回忆下什么是随机变量? 你可以把它跟随机试验绑在一起,就是某个随机实验的结果。你也可以不把它绑在一起,就是有一个变量,这变量的每一个取值背后都有一可能性,这两个二合一就叫随机变量,缺一不可。上面那部分描述概率的那个东西叫做概率密度函数。对于离散型的概率分布,它们统称为分布。一定要记住这个词,分布就是指的随机变量背后衡量可能性的这个东西。

咱们关注的是连续型随机变量,因为我们回归问题处理是一个y是连续的问题,那么到现在为止,我还没把它结合到咱们的机器学习上,咱们先不往那想,咱们先讲对于一种特殊的连续性随机变量,假如说我们说这个变量服从高斯分布,确实自然界中也有很多自然现象服从高斯分布,它的概率密度函数什么?就是如上的f(x)公式,希望大家能给它记下来,深深地刻在脑海里。

下一节,我们讲解最大似然推导mse损失函数(深度解析最小二乘来源)。

 

<think>嗯,用户问的是HTML中的data-trace属性的作用和用法。首先,我得回忆一下HTML中的自定义数据属性相关知识。记得HTML5引入了data-*属性,允许开发者自定义属性来存储数据,这些数据不会影响页面布局,但可以通过JavaScript访问和操作。 用户提到的data-trace可能属于这类自定义属性。我需要确认data-trace的具体用途,可能用于追踪或记录某些信息,比如日志、用户行为分析等。比如,前端框架或监控工具可能会用这个属性来标记元素,方便跟踪事件或错误来源。 接下来要解释data-trace的使用方法。应该给出一个例子,比如在HTML元素中添加data-trace="some-value",然后通过JavaScript的dataset属性来获取这个值。还要说明属性名的转换规则,比如data-trace-id对应dataset.traceId。 另外,需要提到相关的引用,看看用户提供的参考中有没有相关内容。引用[1]提到了traceId,可能和日志追踪相关,可能data-trace用于传递跟踪ID。引用[3]中的Trace32调试工具也有追踪相关的上下文,可能类似。不过这些引用主要是关于后端或调试的,但可以联系起来说明data-trace在前端的类似用途。 还要注意用户可能的应用场景,比如埋点监控、性能分析,或者与后端日志系统集成,传递跟踪ID以便前后端链路追踪。需要举例说明,比如在按钮点击事件中记录追踪信息,或者与日志系统结合使用。 可能用户的实际需求是希望在HTML元素中添加追踪信息,方便调试或分析用户行为。需要确保解释清楚如何设置和获取这个属性,以及它的实际应用案例。 最后,生成相关问题时要围绕data-*属性的其他用途、性能影响、与后端集成的方法等,帮助用户进一步了解相关知识。</think>### HTML `data-trace` 属性的作用及用法 #### 1. **基本含义** `data-trace` 是 HTML5 中自定义数据属性(`data-*`)的一种,用于在 HTML 元素中存储与页面逻辑相关的追踪信息(如日志标记、调试标识等)。这类属性不会影响页面渲染,但可通过 JavaScript 或 CSS 访问,常用于埋点监控、用户行为分析或调试场景[^1][^3]。 #### 2. **使用方法** - **定义属性**:直接在 HTML 标签中添加 `data-trace`,值为任意字符串。 ```html <button data-trace="user-click-login">登录</button> <div data-trace="page-section-1">内容区域</div> ``` - **JavaScript 访问**:通过 `dataset` 属性读取值。 ```javascript const button = document.querySelector('button'); console.log(button.dataset.trace); // 输出 "user-click-login" ``` - **CSS 关联**:结合属性选择器进行样式控制(需结合其他属性): ```css [data-trace="page-section-1"] { border: 1px solid #ccc; } ``` #### 3. **典型应用场景** - **埋点监控**:标记页面元素,记录用户点击或浏览行为。 ```html <a href="#" data-trace="download-button-2023">下载文件</a> ``` - **调试辅助**:为复杂组件添加唯一标识,方便开发时快速定位问题。 - **与日志系统集成**:传递追踪 ID(类似 `traceId`),实现前后端链路追踪。 #### 4. **命名规范与扩展** - 属性名可扩展为多级,例如 `data-trace-id="123"`,对应 JavaScript 中 `dataset.traceId`。 - 值可以是 JSON 字符串,存储结构化数据: ```html <div data-trace='{"id":"A1B2","type":"widget"}'></div> ``` #### 5. **注意事项** - 避免滥用:仅存储与页面逻辑直接相关的轻量数据。 - 兼容性:`dataset` 属性在 IE10 及以下不支持,需改用 `getAttribute('data-trace')`。
评论 8
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

L先生AI课堂

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值