开坑,记录机器学习和自然语言处理阅读的内容。
为什么一个色泽青绿、根蒂蜷缩、敲声浑响的西瓜,人们能判断是正熟的好瓜?
因为我们吃过、看过很多西瓜,所以基于色泽、根蒂、敲声这几个特征我们可以做出相当好的判断。对经验的利用是
我们人类靠自身完成的,计算机能帮忙吗?机器学习正是这样一门学科,它致力于研究如何通过计算的手段,利用经验
来改善自身的系统,在计算机系统中,“经验”通常以“数据”形式存在,因此机器学习研究的主要内容,是关于在计算机
上从数据中产生“模型”的算法,即“学习算法”,有了学习算法,我们把经验数据提供给它,它就能基于这些数据产生模
型,在面对新的情况时,例如一个没剖开的西瓜,模型会给我们提供相应的判断(例如好瓜)。如果说计算机科学是
研究关于“算法”的学问,那么类似的,可以说机器学习是研关于“学习算法”的学问。
下一篇会结合“买西瓜”介绍在机器学习方面的基本概念。