
群体智慧编程
hfutsqliang
热爱了开发
展开
-
发现群组
问题: 如何从各种不同来源中构造算法所需要的数据?? 如何实用两种不同的算法: 更多有关距离度量的知识 简单的图形可视化代码,用于观察所生成的群组 如何将异常复杂的数据投影到二维空间中 数据聚类 数据聚类,是一种用以寻找紧密相关的事、人或观点,并将其可视化的方法。聚类时常被用于数据量很大的应用中。跟踪消费者行为的零售商们,除了利用常规的消费者统计信息外,还可以利用原创 2015-07-07 17:48:14 · 547 阅读 · 0 评论 -
使用协同过滤构建一个推荐引擎
基于物品的过滤(item-based filtering) 基本思路: 为每件物品预先计算好最为相近的其他物品。然后,当我们想为某位用户提供推荐时,就可以查看他曾经评过分的物品,从从中选出排位靠前者,再构造出一个加权列表,其中包含了与这些选中物品最为相近的其他物品。此处最为显著的区别在于,尽管第一步要求我们检查所有的数据,但是物品间的比较不会像用户间的比较那么频繁变化。这也意原创 2015-07-07 11:40:38 · 543 阅读 · 0 评论 -
相似度计算方法
欧几里德距离 > 计算两组数据之间的距离,偏好越相似的人其距离就越短。。。为了处理方便,需要一个函数来对偏好越相近的情况给出越大的值(0~1之间)。皮尔逊相关系数相关度评价 > 皮尔逊相关系数是判断两组叔叔与某一直线拟合程度的一种度量。其对应的公式比欧几里德距离评价的计算公式要复杂,但是在数据不是很规范时会倾向于给出更好的结果。原创 2015-07-06 16:49:56 · 1147 阅读 · 0 评论 -
集体智慧摘要
第一章要点 > 1. 如何利用开放的API来搜集数据,将各种机器学习算法和统计方法结合起来,就可以借助集体智慧的相关方法,对由自己编写的应用程序搜集得到的数据进行分析;同时,也可以从其他地方搜集数据,对数据进行试验 2. 机器学习时人工智能领域中与算法相关的一个子域,允许计算机不断地进行学习,这相当于将一组数据传递给算法,并由算法推断出与这些数据的属性相关的信息,借助这些信息,可原创 2015-07-06 11:47:09 · 473 阅读 · 0 评论