
机器学习
文章平均质量分 90
ziyin_2013
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
熵值法原理、应用及其Python实现
熵值法是一种依据各指标值所包含的信息量的多少确定指标权重的客观赋权法,某个指标的熵越小,说明该指标值的变异程度越大,提供的信息量也就越多,在综合评价中起的作用越大,则该指标的权重也应越大。熵值法可单独进行综合评价;也可以与其他方法相结合,如层次分析法,用熵值法确定各指标的权重,然后运用层次分析法得到各个评价对象的综合得分。原创 2021-05-22 18:26:03 · 31204 阅读 · 14 评论 -
用python构建线性回归和决策树模型实现房价预测
国家整体经济水平的不断提高和人们生活质量的提升,刺激着房屋价格也在不断的上涨。房价是由多个因素决定的,比如国家的宏观调控、居民人均可支配收入、房地产开发投资、住宅销售面积等,这些因素都影响着房价的走势。未来房价走势如何成为人们关心的热点,本文用Python构建线性回归和决策数模型实现房价的预测。原创 2020-12-09 08:18:37 · 14567 阅读 · 94 评论 -
聚类篇——(五)层次聚类
层次聚类主要有两种类型:合并的层次聚类和分裂的层次聚类。合并的层次聚类是一种自底向上的聚类算法,从最底层(即每个数据点为一类)开始,每一次合并最相似的类,直到全部数据点都合并到一类时或者达到某个终止条件时停止,大部分层次聚类都是采用这种方法处理。分裂的层次聚类是一种自顶向下的聚类方法,从最顶层(即全部数据点为一类)开始,然后把根节点分裂为一些子类,每个子类再递归地继续往下分裂,直到每个类中仅包含一个数据点。原创 2020-11-14 15:33:25 · 19366 阅读 · 2 评论 -
聚类篇——(四)有序样品聚类
有序样品聚类要求样品按一定的顺序排列,分类时是不能打乱次序的,即同一类样品必须是互相邻接的。比如要将新中国成立以来国民收入的情况划分为几个阶段,此阶段的划分必须依年份的顺序为依据,又如研究天气演变的历史时,样品是按从古到今的年代排列的,年代的次序也是不能打乱的。有序样品的聚类实质上是找一些分点,将有序样品划分为几个分段,每个分段看做一个类,所以分类也称为分割。显然分点取在不同的位置就可以得到不同的分割。原创 2020-11-03 08:23:12 · 11930 阅读 · 22 评论 -
聚类篇——(三)K-Medoids聚类
K-Medoids算法的基本思想为:** 对于给定聚类数目k,首先随机选择k个代表对象作为初始聚类中心,计算各剩余对象与代表对象的距离并将其分配给最近的一个簇,产生相应的聚类结果。然后开始迭代过程:对于每一次迭代,将随机选择的一个非中心点替代原始中心点中的一个,重新计算聚类结果。若聚类效果有所提高,保留此次替换,否则恢复原中心点。当替换对聚类效果不再有所提高,迭代停止。原创 2020-07-03 22:46:11 · 9572 阅读 · 0 评论 -
聚类篇——(二)K-means聚类
K-means聚类也称快速聚类,属于覆盖型数值划分聚类算法。它得到的聚类结果,每个样本点都唯一属于一个类,而且聚类变量为数值型,并采用划分原理进行聚类。K-means聚类的基本思想:参数K用以决定结果中簇的数目,算法开始时,要在数据集中随机选择K个数据对象用来当做K个簇的初始中心,而将剩下的各个数据对象根据他们和每个聚类簇心的距离选择簇心最近的簇分配到其中。然后重新计算各个聚类簇中的所有数据对象的平均值,并将得到的结果作为新的簇心;逐步重复上述过程直至目标函数收敛为止。原创 2020-06-30 21:29:16 · 5638 阅读 · 0 评论 -
聚类篇——(一)聚类分析概述
聚类分析是一种探索性的分析,在分类的过程中,人们不必事先给出一个分类的标准,聚类分析能够从样本数据出发,自动进行分类。聚类的目标是同一类对象的相似度尽可能大,不同类对象之间的相似度尽可能的小。原创 2020-06-30 21:23:12 · 12318 阅读 · 0 评论 -
用python构建机器学习模型分析空气质量
空气质量(air quality)的好坏反映了空气污染程度,它是依据空气中污染物浓度的高低来判断的。空气污染是一个复杂的现象,在特定时间和地点空气污染物浓度受到许多因素影响。来自固定和流动污染源的人为污染物排放大小是影响空气质量的最主要因素之一,其中包括车辆、船舶、飞机的尾气、工业企业生产排放、居民生活和取暖、垃圾焚烧等。城市的发展密度、地形地貌和气象等也是影响空气质量的重要因素。原创 2019-01-01 12:44:11 · 23837 阅读 · 246 评论 -
利用pyecharts+sklearn实现链家北京二手房房价预测
利用Python的pandas、pyecharts、sklearn库,对之前从链家网站爬取的北京二手房的数据进行统计和可视化,分析北京二手房价格的影响因素,进而构建随机森林回归模型对北京二手房平均价格进行预测。原创 2019-04-22 19:23:11 · 11126 阅读 · 9 评论