http://q.cnblogs.com/q/29230/

博客提供了一个链接 http://q.cnblogs.com/q/29230/ ,并提及了混淆器,可能与混淆器相关知识或讨论有关。
任务描述 本关任务:完成相关性矩阵程序的实现。 相关知识 为了完成本关任务,你需要掌握: 数据可视化——散点图分析 相关分析 数据降维——主成分分析 数据可视化——散点图分析 鸢尾花维度相关性 , IRIS(sepal:萼片,petal:花瓣) 散点图 用来显示两组数据的相关性分布 , 散点图基础代码 import pandas as pd import matplotlib.pyplot as plt data_url = "iris_train.csv" df = pd.read_csv(data_url) x = df.iloc[:,1] y = df.iloc[:,2] fig = plt.figure() ax1 = fig.add_subplot(111) plt.xlabel('x') plt.ylabel('y') ax1.scatter(x,y,c = 'r',marker = 'o') plt.show() , 散点图提升代码 import matplotlib.pyplot as plt import pandas as pd data_url = "iris.csv" df = pd.read_csv(data_url) def mscatter(x, y, ax=None, m=None, **kw): import matplotlib.markers as mmarkers if not ax: ax = plt.gca() sc = ax.scatter(x, y, **kw) if (m is not None) and (len(m) == len(x)): paths = [] for marker in m: if isinstance(marker, mmarkers.MarkerStyle): marker_obj = marker else: marker_obj = mmarkers.MarkerStyle(marker) path = marker_obj.get_path().transformed( marker_obj.get_transform()) paths.append(path) sc.set_paths(paths) return sc x = df.iloc[:,3] y = df.iloc[:,1] c = df.iloc[:,4] m = {0: 's', 1: 'o', 2: 'D', 3: '+'} cm = list(map(lambda x: m[x], c)) fig, ax = plt.subplots() scatter = mscatter(x, y, c=c, m=cm, ax=ax, cmap=plt.cm.RdYlBu) plt.show() , 参考: https://blog.csdn.net/H_lukong/article/details/90139700 https://www.cnblogs.com/star-zhao/p/9847082.html 相关分析 离散标签类数据:Χ2 (chi-square) test x2=∑Exprcted(Observed−Expected)2​ 连续数值类数据:相关系数、协方差性 rp,q​=(n−1)σp​σq​∑(p−p​)(q−q​)​=(n−1)σp​σq​∑(pq)−np​q​​ 数据降维——主成分分析 数据降维方法:学习各属性之间的相关性(PCA主成份分析法) z1​=0.7x1​+0.76x2​+0.68x3​+0.00017x4​+0.00076x5​+0.00068x6​ z2​=0.0007x1​+0.00076x2​+0.00068x3​+0.7x4​+0.76x5​+0.68x6​ 主成分分析编程实践一 from sklearn.decompositio
最新发布
03-14
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值