机器学习是一种能够赋予机器学习的能力以此让它完成直接编程无法完成的功能的方法。
机器学习是一种通过利用数据,训练出模型,然后使用模型预测的一种方法。
首先,我们需要在计算机中存储历史的数据。
接着,我们将这些 数据通过机器学习算法进行处理,这个过程在机器学习中叫做“训练”,处理的结果可以被我们用来对新的数据进行预测,这个结果一般称之为“模型”。
对新数据 的预测过程在机器学习中叫做“预测”。
“训练”与“预测”是机器学习的两个过程,“模型”则是过程的中间输出结果,“训练”产生“模型”,“模型”指导 “预测”。
NFL定理:没有免费的午餐(所有问题出现的机会相同或者所有问题同等重要)
人工智能(artificial intelligence)
逻辑理论家(Logic Theorist)
通用问题求解(general problem solving)
ILP(inductive logic programming)归纳逻辑程序设计
统计学习(statistical learning)
支持向量机(support vector machine)简称SVM
数据获取、数据管理、数据分析、仿真实验
机器学习、云计算、众包(crowdsourcing)
数据挖掘(data mining)的支撑为机器学习领域和数据库领域
迁移学习(transfer learning)
类比学习(learning by analogy)
深度学习(deep learning)
多释原则(principle of multiple explanations)
集成学习(ensemble learning)
版本空间(version space)
梯度下降法:主要运用在线型回归,逻辑回归,神经网络,推荐算法中;
牛顿法: 主要运用在线型回归中;
BP算法: 主要运用在神经网络中;
SMO算法:主要运用在SVM中。
机器学习(machine learning)
模型(model) :计算机层面的认知
学习算法(learning algorithm):从数据中产生模型的方法
数据集(data set):一组记录的合集
示例 (instance) :对于某个对象的描述
样本 (sample) :也叫示例
属性(attribute) :对象的某方便表现或特征
特征 (feature) :同属性
属性值 (attribute value):属性上的取值
属性空间(attribute space):属性张成的空间
样本空间/输入空间(sample space):同属性空间
特征向量 (feature vector):在属性空间里每个点对应一个坐标向量,把一个示例称作特征向量
维数 (dimensionality):描述样本参数的个数(也就是空间是几维的
学习(learning)/训练(training):从数据中学得模型
训练数据 (training data):训练过程中用到的数据
训练样本(training sample):训练用到的每个样本
训练集 (training set):训练样本组成的集合
假设 (hypothesis):学习模型对应了关于数据的某种潜在规则
真相 (group-true):真正存在的潜在规律
学习器 (learner):模型的另一种叫法,把学习算法在给定数据和参数空间的实例化
预测 (prediction):判断一个东西的属性
标记 (label):关于示例的结果信息,比如我是一个“好人”。
样例 (example):拥有标记的示例
标记空间/输出空间(label space):所有标记的集合
分类 (classification)