机器学习文本增强技术详解
1. 机器学习文本增强概述
机器学习文本增强是一种先进的技术,与传统文本增强方法不同,它使用预训练的机器学习模型来创建额外的自然语言处理(NLP)训练数据,形成一个循环过程。虽然本书不涉及机器学习编码,但了解使用库和机器学习进行文本增强的区别是有益的。
1.1 库与机器学习的区别
- 库 :图像、文本或音频增强库遵循传统编程方法,使用结构化数据、循环和条件语句。例如,实现
_print_aug_reserved()方法的伪代码如下:
# define synonym words, pseudo-code
reserved = [['happy', 'joyful', 'cheerful'],
['sad', 'sorrowful', 'regretful']]
# substitute the word with its synonym, pseudo-code
for i, word in (input_text):
for set_word in (reserved):
for i, syn in set_word:
if (syn == word):
input_text[i] = set_word[i+1]
- 机器学习 :基于13种已知的机器学习算法,如深度学习(DL)、双向编码器
超级会员免费看
订阅专栏 解锁全文
4800

被折叠的 条评论
为什么被折叠?



