
机器学习
JohnieLi
cs qq:1187426712
展开
-
机器学习常用算法
机器学习无疑是当前数据分析领域的一个热点内容。很多人在平时的工作中都或多或少会用到机器学习的算法。本文总结一下常见的机器学习算法,以供参考。机器学习的算法很多,很多算法是一类算法,而有些算法又是从其他算法中延伸出来的。这里从两个方面进行总结,第一个方面是学习的方式,第二个方面是算法的类似性。一、学习方式根据数据类型的不同,对一个问题的建模有不同的方式。在机器学习或者人工智能领域,人们首先会考虑算法的转载 2017-09-25 16:37:55 · 475 阅读 · 0 评论 -
向量空间中各类距离表示
1. 闵可夫斯基距离严格意义上讲,闵可夫斯基距离不是一种距离,而是一组距离的定义。两个n维变量A(x11,x12,…x1n)与B(x21,x22,…,x2n)间的闵可夫斯基距离的定义为: 其中p是一个变参数[ ] 当p=1时,就是曼哈顿距离。[ ] 当p=2时,就是欧式距离。[ ] 当p→∞时,就是切比雪夫距离。2. 欧氏距离(Euclidean Distance...转载 2018-04-02 13:28:57 · 18585 阅读 · 0 评论 -
准确率(Accuracy), 精确率(Precision), 召回率(Recall)和F1-Measure
准确率(Accuracy), 精确率(Precision), 召回率(Recall)和F1-Measure机器学习(ML),自然语言处理(NLP),信息检索(IR)等领域,评估(Evaluation)是一个必要的 工作,而其评价指标往往有如下几点:准确率(Accuracy),精确率(Precision),召回率(Recall)和F1-Measure。(注: 相对来说...转载 2018-06-12 23:07:12 · 4329 阅读 · 0 评论 -
随机森林(Random Forest)
随机森林(Random Forest)1 什么是随机森林? 作为新兴起的、高度灵活的一种机器学习算法,随机森林(Random Forest,简称RF)拥有广泛的应用前景,从市场营销到医疗保健保险,既可以用来做市场营销模拟的建模,统计客户来源,保留和流失,也可用来预测疾病的风险和病患者的易感性。最初,我是在参加校外竞赛时接触到随机森林算法的。最近几年的国内外大赛,包括2013年百度校园电影...转载 2018-06-07 10:50:00 · 1006 阅读 · 0 评论 -
一文搞懂HMM(隐马尔可夫模型)
一文搞懂HMM(隐马尔可夫模型) 什么是熵(Entropy)简单来说,熵是表示物质系统状态的一种度量,用它老表征系统的无序程度。熵越大,系统越无序,意味着系统结构和运动的不确定和无规则;反之,,熵越小,系统越有序,意味着具有确定和有规则的运动状态。熵的中文意思是热量...转载 2018-06-07 13:11:30 · 1341 阅读 · 0 评论 -
ML神器:sklearn的快速使用
ML神器:sklearn的快速使用 传统的机器学习任务从开始到建模的一般流程是:获取数据 -> 数据预处理 -> 训练建模 -> 模型评估 -> 预测,分类。本文我们将依据传统机器学习的流程,看看在每一步流程中都有哪些常用的函数以及它们的用法是怎么样...转载 2018-07-08 15:40:35 · 543 阅读 · 0 评论 -
基于深度学习的目标检测技术演进:R-CNN、Fast R-CNN、Faster R-CNN
基于深度学习的目标检测技术演进:R-CNN、Fast R-CNN、Faster R-CNN object detection我的理解,就是在给定的图片中精确找到物体所在位置,并标注出物体的类别。object detection要解决的问题就是物体在哪里,是什么这整个流程的问题。然而,这个问...转载 2018-09-13 21:45:08 · 230 阅读 · 0 评论 -
pyltp安装和小白入门
之前一篇文章我介绍了一下如何在windows下安装pyltp, 但是自我感觉对小白还是不太友好, 因为我也是小白出身(潜在语义你懂), 所以我对小白有一种发自内心的感情纠结, 所以思前想后辗转反侧以后, 我决定再补充一篇入门教程.我的开发环境:win10 64bitpython3.5 64bit我的意思是不要问我python怎么装上去的.安装参考哈工大自然语言处理ltp在window...转载 2020-04-28 09:41:11 · 452 阅读 · 0 评论