meadowair@20150125
写在前面的话
机器学习-从无序海量的数据中抽取出有用的信息,方法可分为监督学习和非监督学习两大类,监督学习的主要任务(算法)是分类和回归,通过特征来预测目标变量的值,非监督学习的主要任务(算法)是聚类和密度估计,通过特征分组或者估计分组的相似程度,监督学习与非监督学习最显著的区别是否预测目标变量的值。
希望能掌握的知识点
机器学习应用的一般方法
使用Python语言开发机器学习算法原型
Python科学计算环境
学习机器学习需要掌握大量线性代数、概率统计等数学知识,算法实现使用Matlab应该算是最佳选择,不过本次学习我打算在Ubuntu上实现,因此选择了Python语言,开始之前需要在Ubuntu上搭建Python科学计算环境,命令
sudo apt-get install python
sudo apt-get install python-pip
sudo apt-get install python-dev
sudo apt-get install numpy
sudo apt-get install scipy
sudo apt-get install matplotlab
至此已搭建好Python科学计算环境,在Ubuntu终端中输入python启动外壳程序,输入代码验证
>>>from numpy import *;
引入numpy库
>>>A=mat(random.rand(4,4));
创建4x4的随机矩阵
>>>B=A.I;
计算逆矩阵
>>>C=A*B;
矩阵相乘等于单位矩阵