Day 1
机器学习所关注的问题是:计算机如何根据经验的累加提升自己的性能?
1.1学习问题的描述:
定义: 对于某类任务 T 和性能度量 P,如果一个计算机程序在 T 上以 P 衡量的性能随着经验 E 而自我完善,那么我们称这个计算机程序在从经验 E 学习。
定义一个学习问题:
任务的种类,衡量任务提升的标准,检验的来源。
1.2设计一个学习系统
实验生成器(Experiment Generator),它以当前的假设(当前学到的函数)作为输入,输出一个新的问题(例如,最初的棋局)供执行系统去探索。它的角色是挑选新的练习问题,以使整个系统的学习速率最大化。在我们的例子中,实验生成器采用了非常简单的策略:它总是给出一个同样的初始棋局来开始新的一盘棋。更完善的策略可能致力于精心设计棋子位置以探索棋盘空间的特定区域。
•

• 机器学习从不同的学科吸收概念,包括人工智能,概率和统计,计算复杂性,信息论,心理学和神经生物学、控制论、以及哲学。
• 一个完整定义的学习问题需要一个明确界定的任务、性能度量标准以及训练经验的来源。
• 机器学习算法的设计过程中包含许多选择,包括选择训练经验的类型、要学习的目标函数、该目标函数的表示形式、以及从训练样例中学习目标函数的算法。
• 学习的过程即搜索的过程,搜索包含可能假设的空间,使得到的假设最符合已有的训练样例和其他先验的约束或知识。本书的大部分内容围绕着搜索各种假设空间(例如,包含数值函数、神经网络、决策树、符号规则的空间)的不同学习方法,和理论上这些搜索方法在什么条件下会收敛到最佳假设。
*有很多关于机器学习最新研究成果的优秀资源可供阅读。相关的杂志包括《机器学习》(Machine Learning),《神经计算》(Neural Computation),《神经网络》(Neural Networks),《美国统计协会期刊》(Journal of the American Statistical Association)和《IEEE 模式识别和机器智能学报》(IEEE Transactions on Pattern
Analysis and Machine Intelligence)。也有大量的年会覆盖了机器学习的各个方面,包括国际机器学习会议(ICML),神经信息处理系统
(NIPS),计算学习理论会议(CCLT),国际遗传算法会议(ICGA),国际知识发现和数据挖掘会议(ICKDD),欧洲机器学习会议(ECML)等。
第一章主要是序言,讲了西洋棋学习的算法以及实现。