
机器学习
文章平均质量分 85
机器学习
不吃饭就会放大招
人工智能领域专家博主
展开
-
Hamming distance(汉明距离)
Hamming distance 是一种用于度量两个等长字符串之间的差异性的度量方式。它通常用于比较两个二进制字符串或等长的编码向量。Hamming 距离的计算方式非常简单,它只关注两个字符串中不同的位置,并计算它们的个数。在信息论、编码理论和计算机科学中,Hamming 距离经常被用作误码检测和纠错码设计等方面的基础概念。原创 2023-06-28 09:18:16 · 2259 阅读 · 0 评论 -
目标函数(Objective Function)、损失函数(Loss Function)与代价函数(Cost Function)
目标函数(Objective Function)、损失函数(Loss Function)、代价函数(Cost Function)在某些情况下可以互换使用,本文将详细说明它们之间有什么区别。原创 2023-06-21 11:38:46 · 3247 阅读 · 0 评论 -
机器学习算法常用评价指标总结
1. 准确率准确率(Accuracy)是指 判断正确的样本数占所有样本数的比例,也就是如其计算式所说的,正确地判断为正样本和正确地判断为负样本的总数,占样本总数的比例。Acc=TP+TNTP+TN+FP+FNAcc = \frac{TP + TN}{TP + TN + FP + FN}Acc=TP+TN+FP+FNTP+TN但是单纯正确率高不能代表算法好,尤其是在 正负样本不均衡 的情况下,准确率有很大的误导性。比如说,判断一个病人有没有患癌,10 位病人中只有 1 位是阳性的(也就是患癌的),而分原创 2019-11-08 10:42:00 · 3483 阅读 · 0 评论 -
SVM + HOG实现图像分类
训练集标签和数量的统计结果:提取到的 HOG 特征初步了解特征的选区是否合适,不适合可以调节 extractHOGFeatures 里的参数,比如 cellsize,blocksize,bins等。参考:extractHOGFeature只列出几项最终的分类结果:...原创 2019-06-02 11:32:21 · 4951 阅读 · 1 评论 -
KNN 算法的实例应用
为了提高给 Helen 女士匹配约会对象的成功率,收集了各位男士的以下三种信息:约会数据:datingTestSet.txt先看一下数据集的内容:这里截取了三行,前三列分别是每年的飞行里程数、玩游戏所耗时间百分比和每周消费的冰淇淋公升数,最后一列是 Helen 女士对他们的 feel,largeDoses 表示 Helen 女士认为他非常有魅力,smallDoses 表示 Helen 女士对他感觉一般般,而 didntLike 则表示 Helen 女士不喜欢他。1. 准备数据:从文本文件中解析数据将收集转载 2019-10-22 23:52:17 · 3149 阅读 · 0 评论 -
机器学习算法(二)KNN
比如有一个训练集,且训练集中的每个数据都存在标签,即我们知道样本集中每一数据与所属分类的对应关系。输入没有标签的新数据后,将新数据的每个特征与样本集中数据对应的特征进行比较,然后算法提取样本集中特征最相似(最近邻)数据的分类标签。一般选择样本数据集中前 k 个最相似的数据,k 为不大于 20 的整数。最后,选择这 k 个最相似数据中出现次数最多的分类,作为新数据的分类标签。优点:精度高、对异常值不敏感、无数据输入假定缺点:计算复杂度高、空间复杂度高使用数据范围:数值型和标称型(1)收集数据:可以使用任何原创 2019-06-02 11:30:55 · 2090 阅读 · 1 评论 -
机器学习算法(一)SVM
支持向量机(support vector machines,SVM)是一种二分类模型,它将实例的特征向量映射为空间中的一些点,SVM 的目的就是想要画出一条线,以 “最好地” 区分这两类点,以至如果以后有了新的点,这条线也能做出很好的分类。SVM 适合中小型数据样本、非线性、高维的分类问题。SVM 最早是由 Vladimir N. Vapnik 和 Alexey Ya. Chervonenkis 在1963年提出,目前的版本(soft margin)是由 Corinna Cortes 和 Vapnik 在1原创 2019-06-02 11:31:08 · 277927 阅读 · 44 评论 -
判别式模型 & 生成式模型
判别式模型 & 生成式模型参考:https://blog.youkuaiyun.com/asdfsadfasdfsa/article/details/80960315判别式模型,就是只有一个模型,你把测试用例往里面一丢, label 就出来了,如 SVM。生成式模型,有多个模型(一般有多少类就有多少个模型),你得把测试用例分别丢到各个模型里面,最后比较其结果,选择最优的作为 label,如朴素贝...转载 2019-05-20 08:37:46 · 500 阅读 · 0 评论