
数据分析
Jorocco
爬行者!
展开
-
PCA——主成分分析
主成分分析转载 2017-04-21 10:40:40 · 550 阅读 · 0 评论 -
Python数据分析与挖掘(一)
1、数据处理1.1 模块的使用Pandas的使用#!/usr/bin/python# -*-coding:utf-8-*-# __author__ = 'ShenJun'import pandas as pda'''series:系列数据'''a=pda.Series([8,9,2,1])'''结果:0 81 92 23 1dt...原创 2018-05-21 13:54:16 · 1402 阅读 · 0 评论 -
Python数据分析与挖掘(二)
1、KNN算法#!/usr/bin/python# -*-coding:utf-8-*-# __author__ = 'ShenJun'import numpy as npimport operatordef knn(k,testdata,traindata,labels): ''' :param k:表示到最近的k个点,即以最近的k个点的距离来对测试数据所属...原创 2018-05-21 14:09:06 · 552 阅读 · 0 评论 -
机器学习算法总结(一)
1、TF-IDF文本相似度分析余弦相似度计算个体间的相似性,即将两个个体的特征向量化,通过余弦公式计算两者之间的相似性。 通过计算模型公式可以明确的求出余弦相似度的值。那么对于我们写程序实现这个算法,就是把两个个体转换为向量,然后通过这个公式求出最终解。 比如向量a(x1, x2, x3, x4, x5),向量b(y1, y2, y3, y4, y5)。分子为(x1*y1)+(...原创 2018-08-30 16:29:29 · 5798 阅读 · 1 评论