数据集
UCI机器学习库——350多个可检索数据集,几乎涵盖每一个主题。
http://archive.ics.uci.edu/ml/index.php
Kaggle数据集——Kaggle社区上的100多个数据集。
https://www.kaggle.com/
Data.gov——由美国政府发布的开放数据集。
https://www.data.gov/
金融数据集
Quandl——数据市场,提供免费的金融和经济数据。
https://www.quandl.com/
Quantopian——定量金融社区,开发交易算法提供了一个免费的平台。
美国基础档案文件——5000多家美国公司5年的基本数据。
http://www.usfundamentals.com/download/
比赛
自然语言处理
结巴中文分词:做最好的 Python 中文分词组件
英文资源
Books
《An Introduction to Statistical Learning with Application in R》
《Elements of Statistical learning》
机器学习python类库速查表
Essential Cheat Sheets for deep learning and machine learning researchers
https://github.com/kailashahirwar/cheatsheets-ai
数据资源
视频
吴恩达在Coursera的Machine Learning视频
吴恩达在Coursera的Deep Learning视频
李飞飞在斯坦福的Convolutional Neural Network视频(CS231n)
Geoffrey Hinton 在 Coursera上面的Deep Learning视频
一些有用的短视频
Backpropagation in 5 minutes.
https://www.youtube.com/watch?v=q555kfIFUCM
看了这个视频,豁然开朗,知道什么是Backpropagation
statquest
https://www.youtube.com/user/joshstarmer
这个频道让我明白了什么是PCA,什么是GBDT,感觉还是比较深入浅出的。
这个视频解释了pandas下面的SettingWithCopyWarning
https://www.youtube.com/watch?v=4R4WsDJ-KVc
其他
论文笔记,帮助理解论文
http://www.shortscience.org
232

被折叠的 条评论
为什么被折叠?



