
数据挖掘
文章平均质量分 62
Analyst128
主要方向:数据可视化以及爬虫系列。微信:qingfxy28
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
KNN算法及其应用案例
1.常见的分类算法:(1).KNN算法(2).贝叶斯算法(3).决策树算法(4)人工神经网络算法(5)支持向量机(SVM)算法2.今天我们用KNN算法解决手写体数字的识别问题(包括验证码识别,二维码识别等都可以归属为同一类问题)KNN算法又名K-近邻算法,总体思想是:通过把现实中的数据映射到坐标系,然后通过计算"点"之间的距离(欧几里得公式)sqr[(x1-xm)**2+(y1-ym...原创 2018-08-20 22:27:01 · 11354 阅读 · 2 评论 -
决策树算法及其应用案例
决策树算法主要分为三类:ID3、C4.5、CART算法以ID3算法为例:对上表某图书销量进行预测.思考:建立测试模型,各个变量数据权重?数据的转化?重点在于:计算各个信息熵(数据预处理),可参考百度百科内容决策树算法模块:关注点:对数据需要进行预处理,转化为结构化数据,然后进行分析处理,信息熵的计算,权重大小的比较数据的预处理模块:#数据的处理模块fname="C:/Use...原创 2018-08-20 22:29:21 · 12578 阅读 · 2 评论 -
贝叶斯算法及其应用案例
贝叶斯分类算法:贝叶斯分类是统计学的一种分类算法,它是一类利用概率统计知识进行分类的算法。在许多场合,朴素贝叶斯(Naïve Bayes,NB)分类算法可以与决策树和神经网络分类算法相媲美。缺陷:与其本身的设定有关,由于贝叶斯假设一个属性值对给定类的影响独立于其它属性的值,但是该假设在实际情况中经常是不成立的,因此其分类准确率可能会下降。升级版:降低独立性假设的贝叶斯分类算法,如TAN(tre...原创 2018-08-20 22:27:56 · 9806 阅读 · 2 评论 -
数据分析在保险销售中的应用
从营销的角度看数据产生的价值。此部分报告是笔者曾经在新人班中,给新人做过的培训内容(产生一定的成效)。在此,作详细记录(考虑到部分敏感词汇,故而部分内容省略)。一、背景分析及问题提出1.背景分析2.问题提出二、用到的主要工具三、用户画像解读四、数据清洗1.用Excel对数据进行预处理2.查看是否存在缺失值 五、特征分析1.客户区域分布2.从手机号中提取运...原创 2018-08-31 16:36:19 · 8595 阅读 · 5 评论 -
一种新型分割图像中人物的方法,基于人物动作辨认
想要进行图像分割,传统方法是先检测图中物体,在进行分离。在本文中,来自清华大学、腾讯AI研究室和英国卡迪夫大学的研究者们提出了一种新型分割图像中人物的方法,基于人物动作辨认。以下是论智对原文的编译。 图像分割的一般方法是先对物体进行检测,然后用边界框对画中物体进行分割。最近,例如Mask R-CNN的深度学习...转载 2018-08-04 00:02:25 · 2667 阅读 · 1 评论 -
Excel本身就能编写大量基础机器学习算法
编者按:当初学者第一次接触机器算法时,直观了解算法正在做什么是一项非常重要的任务,这也是论智一直推崇可视化方法的原因之一。虽然初级算法的数学计算并不难掌握,但当他们一看到满篇的数学理论和符号,学习下去的兴致和气势就消减了不少。 作为一名数据工作者,这年头“熟悉机器学习算法”远比“精通Excel”在求职市场上要抢手得多,但前者的“熟悉”究竟是熟悉到什么程度呢?Ex...转载 2018-07-19 22:19:15 · 4802 阅读 · 0 评论 -
数据分析岗位需求分析报告
1.前言2.用到的工具3.网页结构分析4.数据预处理5.数据分析岗位分布情况5.1公司的城市分布5.2公司的融资情况 5.3岗位福利状况 6.数据分析岗位的发展状况6.1各城市平均薪资待遇6.2不同融资阶段平均工资待遇7.数据分析师岗位招聘要求7.1统计量描述 7.2学历与职位需求7.3学历水平与工资7.4工作经验与职位需求7.5...原创 2018-09-05 18:09:09 · 15577 阅读 · 3 评论