数据相关性分析:以2012伦敦奥运会运动员数据为例
1. 数据获取与检查
可以从出版商网站或https://github.com/clojuredatascience/ch3-correlation 下载示例代码。关于数据的更多信息,可查阅本章示例代码中的Readme文件或访问http://wiki.clojuredatascience.com 。
拿到新数据集的首要任务是研究它,确保理解其包含的内容。 all-london-2012-athletes.xlsx 文件已随本章示例代码提供,可使用Incanter来检查数据,代码如下:
(ns cljds.ch3.examples
(:require [incanter.charts :as c]
[incanter.core :as i]
[incanter.excel :as xls]
[incanter.stats :as s]))
(defn athlete-data []
(-> (io/resource "all-london-2012-athletes.xlsx")
(str)
(xls/read-xls)))
(defn ex-3-1 []
(i/view (athlete-data)))
运行上述代码(在REPL中或使用 lein run –e 3.1 在命令行运行),可以看到数据的列标签清晰,包含以下信息:
| 信息 | 描述 |
超级会员免费看
订阅专栏 解锁全文
23

被折叠的 条评论
为什么被折叠?



