模糊匹配是指根据名词中字符的相似特征,将两个相似的名词进行匹配,以获取另一个表中对应名词的属性数据。
相同名词之间的匹配可以参考以前的一篇文章(利用R解决常见的数据匹配问题),但是现实中,由于数据来源不同,同一对象的名称可能不同,但两个名称之间仍有一定的相似性,本文利用分词、投票的原理,将两个表格中相似程度最高的两个名词进行匹配。
示例数据如下图:
代码如下:
- 设置工作空间,加载数据
#library need packages
模糊匹配是指根据名词中字符的相似特征,将两个相似的名词进行匹配,以获取另一个表中对应名词的属性数据。
相同名词之间的匹配可以参考以前的一篇文章(利用R解决常见的数据匹配问题),但是现实中,由于数据来源不同,同一对象的名称可能不同,但两个名称之间仍有一定的相似性,本文利用分词、投票的原理,将两个表格中相似程度最高的两个名词进行匹配。
示例数据如下图:
代码如下:
#library need packages