机器学习中的记忆学习与深度学习技术解析
1. 记忆学习(MBL)概述
传统的机器学习类型倾向于构建紧凑且具有代表性的模型来处理训练数据,而记忆学习(Memory-based Learning,MBL)则是一种“懒惰”学习方式。它不会将训练数据压缩成通用的模型,而是将所有训练数据完整地保留在内存中。在进行分类时,才会对训练数据进行实际处理,通过相似度或距离度量将输入数据与训练数据进行匹配。
2. IB1距离度量
IB1是一种著名的距离度量方法,其简化版本的代码如下:
def IB1(a,b):
return sum([delta(a[i],b[i]) for i in range(len(a))])
def delta(x,y):
if x==y:
return 0
if x!=y:
return 1
该度量方法基于特征值计算两个特征向量之间的距离,对于符号(非数值)值采用精确匹配。大多数MBL算法会通过特征加权(如基于信息增益的加权)或示例加权来扩展这些距离度量。
3. MBL在自然语言处理(NLP)中的优势
MBL在NLP领域具有显著优势,能够处理语言中的例外情况。以荷兰语中的词形变化为例,如名词的小词形式:
| 原词 | 小词形式 |
| ---- | ---- |
| gat(小孔) | gaatje |
| pad(小径) | paadje |
| blad(小叶子) | blaadje |
超级会员免费看
订阅专栏 解锁全文
3345

被折叠的 条评论
为什么被折叠?



