- 博客(4)
- 收藏
- 关注
原创 在Python里用fastText处理有拼写错误的文本
用fastText处理有拼写错误的文本与Python实现作者:牛伯雨上次我们介绍了一种将以字符串形式存在的词通过对大量参数的训练转换为用多维度向量表示的词,即Word2Vec。在上次的文章中,我们以一个简单的例子,用Python中的Numpy包从零开始训练了一个迷你Word2Vec模型。这次我们将简要介绍另一种词的向量表示法:fastText。Word2Vec的短板Word2Vec虽然将词的向量表示效率和性能相较于以前的One-hot表示法或者奇异值分解法提高了不少,但是仍然存在一些不足。比如说,
2021-09-07 03:37:54
534
原创 利用Python Numpy从零开始步步为营计算Word2Vec词向量
利用Python Numpy从零开始步步为营计算Word2Vec词向量@牛伯雨词向量建模是自然语言处理当中的重要基础步骤。有了用向量表示的词汇,计算机就可以更好地处理文本数据了。2013年,Mikolov et al. (2013)提出的Word2Vec是一个里程碑式的词向量建模方法。最近看到一篇Derek Chia的关于徒手计算Word2Vec的博文An implementation guide to Word2Vec using NumPy and Google Sheets,作者利用表格软件表
2021-02-17 06:25:02
852
原创 浅谈λ演算与Python的lambda函数
Python里有一个十分方便的功能,那就是lambda函数。使用这一功能,可以让代码显得简洁明快,甚至一行搞定很多步运算。在讨论Python的lambda运算之前,我们先来看看它的原型:λ演算。
2021-01-18 05:21:44
756
原创 使用WordNet和Lesk算法进行英文消歧义的Python实现
快速浏览使用WordNet和Lesk算法进行英文消歧义的Python实现概览WordNet初识WordNetWordNet 在 Python 中的使用Lesk算法Lesk算法经典版Lesk算法经典版的Python实现Lesk算法的简化版Lesk算法的简化版的Python实现使用WordNet和Lesk算法进行英文消歧义的Python实现作者:牛伯雨概览英文中有一个用来消歧义的经典算法——Lesk算法。实现这一算法需要一个重要零组件:WordNet。Lesk算法还有一个简化版本,我们也会在后面讨论。
2021-01-16 08:10:38
2679
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅