- 博客(3)
- 收藏
- 关注
原创 【算法面经】《百面机器学习 算法工程师带你去面试》笔记
9.训练集和验证集划分:留出法(37分),k折交叉法,自助法(有放回n次抽样,36.8%)正则化、Dropout、扩充数据集、缩减模型、预训练fine-tune、集成学习。(2)GMM聚类:EM算法求解:假设每簇数据遵循正态分布(椭圆状)、生成式模型。外部:Jaccard指数(↑)、Rand指数(↑)、FM指数(↑)(3)聚类簇的定义:中心定义、密度定义、概念定义、连通定义。Min-max归一化:(x-min)/(max-min)CRF、HMM、最大熵模型、朴素贝叶斯模型、主题模型。
2023-11-30 14:47:46
1352
原创 【算法面经】统计学习方法笔记
(3)随机选取数据点,若误分类,修改w、b,直至正确分类。(2)半朴素贝叶斯模型:超父:至于其中一个属性有相关关系。Adaboost:加法模型、前向分步模型、指数损失函数。(1)生成式:Naïve Bayes,HMM,GMM。(2)Loss = 误分类点对超平面的距离之和。求大:信息增益 = H(D|A)-H(D)求大:信息增益率 = 信息增益/H(D)(2)求解标注问题:CRF,HMM。高斯核、正定核、字符串核、多项式核。(2)回归:R2-score。非概率模型:Y=f(X)(1)+1:拉普拉斯平滑。
2023-11-30 14:38:08
52
原创 【算法面经】西瓜书阅读笔记
输入样本扰动、模型参数扰动、输入属性扰动、输出表示扰动。多变量决策树:节点判断条件含有and 或者or。OvO、OvR可能会导致类别不平衡。功能神经元:含有激活函数的神经元。L1+逻辑回归:Lasso回归。L2+逻辑回归:Ridge回归。标准BP算法在DNN中难以收敛。节省训练开销:预训练、参数共享。β越大,Fβ对于召回率越关注。DNN的隐层层数通常>=8。预训练+fine-tune。ECOC编码具有容错能力。使得数据由稀疏变稠密。正则化方法或梯度裁切。Relu系列激活函数。
2023-11-30 14:35:32
42
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人