- 博客(11)
- 收藏
- 关注
原创 吃瓜理解-对数几率回归
例1:信息熵,若x有两种取值a,b,如果我确定取值一定为a,那么它的信息熵就是很小的;如果取a值的概率为1/2,b值的概率为1/2,则信息熵较高;若a为3/4,b为1/4,则信息熵较一定取a值的情况高,较a的概率为1/2的概率低。其实只要是满足y取1时,就用p1;y取0时就用p0即可;这是依据我们前一步推导所能想到的。以一个二分类任务为例设正例为1,负例为0;设正例概率为p,则取负例的概率为1-p。在线性模型的基础上套一个映射函数来实现分类功能,最终的输出其实是一个概率。到此两种方法,殊途同归。
2025-02-12 20:29:13
256
原创 吃瓜理解(西瓜书+南瓜书)
例如以上举例中如果训练集中含有相同颜色但根蒂不蜷缩的坏瓜,模型学到真相的概率则也会增大,从特征工程的角度来说,通常对特征数值化越合理,特征收集越全越细致,模型效果通常越好,因为此时模型更易学得样本之间潜在的规律。由于样本采用的是标明各个特征取值的“特征向量"来进行表示,根据线性代数的知识可知,有向量便会有向量所在的空间,因此称表示样本的特征向量所在的空间为样本空间,通常用花式大写的x表示;例1就是分类型,把瓜分为好瓜坏瓜;标记通常也看做样本的一部分,如例1,如果它打开是个好瓜,那“好”本身也是对瓜的描述;
2025-02-10 21:47:55
689
原创 最小生成树:克鲁斯卡尔与普利姆
普利姆每次选取不在MST(最小生成树)中的点,直到图中所有点都在MST中,但它比较贪,所以选的点是离MST距离最近的点;由于选的是不在MST中的点,所以肯定不会有环。
2024-12-19 13:01:17
342
原创 图是否有环的判定
首先明确三个概念,未访问的节点记为白节点,正在访问但没访问完(说白了,就是一条路没走到头还没退递归栈)的为灰节点,已经访问完的退出递归栈的为黑节点。有了这个概念,思路就很简单了,如果访问过程中遇到了灰节点说明指向祖先了,则存在环,不明白的动手画一画,或者等过两天我的修改。至于邻接矩阵的,可以选择转化为邻接表;连通分量不为1,拓扑排序(有向图)都可以判断,日后先下整理。
2024-12-18 14:45:55
112
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人