自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(4)
  • 收藏
  • 关注

原创 在Python里用fastText处理有拼写错误的文本

用fastText处理有拼写错误的文本与Python实现作者:牛伯雨上次我们介绍了一种将以字符串形式存在的词通过对大量参数的训练转换为用多维度向量表示的词,即Word2Vec。在上次的文章中,我们以一个简单的例子,用Python中的Numpy包从零开始训练了一个迷你Word2Vec模型。这次我们将简要介绍另一种词的向量表示法:fastText。Word2Vec的短板Word2Vec虽然将词的向量表示效率和性能相较于以前的One-hot表示法或者奇异值分解法提高了不少,但是仍然存在一些不足。比如说,

2021-09-07 03:37:54 534

原创 利用Python Numpy从零开始步步为营计算Word2Vec词向量

利用Python Numpy从零开始步步为营计算Word2Vec词向量@牛伯雨词向量建模是自然语言处理当中的重要基础步骤。有了用向量表示的词汇,计算机就可以更好地处理文本数据了。2013年,Mikolov et al. (2013)提出的Word2Vec是一个里程碑式的词向量建模方法。最近看到一篇Derek Chia的关于徒手计算Word2Vec的博文An implementation guide to Word2Vec using NumPy and Google Sheets,作者利用表格软件表

2021-02-17 06:25:02 852

原创 浅谈λ演算与Python的lambda函数

Python里有一个十分方便的功能,那就是lambda函数。使用这一功能,可以让代码显得简洁明快,甚至一行搞定很多步运算。在讨论Python的lambda运算之前,我们先来看看它的原型:λ演算。

2021-01-18 05:21:44 756

原创 使用WordNet和Lesk算法进行英文消歧义的Python实现

快速浏览使用WordNet和Lesk算法进行英文消歧义的Python实现概览WordNet初识WordNetWordNet 在 Python 中的使用Lesk算法Lesk算法经典版Lesk算法经典版的Python实现Lesk算法的简化版Lesk算法的简化版的Python实现使用WordNet和Lesk算法进行英文消歧义的Python实现作者:牛伯雨概览英文中有一个用来消歧义的经典算法——Lesk算法。实现这一算法需要一个重要零组件:WordNet。Lesk算法还有一个简化版本,我们也会在后面讨论。

2021-01-16 08:10:38 2679

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除