
Embedding
文章平均质量分 66
Just Jump
勿忘来时路上的脚印。站在巨人的肩膀上。
你没有比别人更努力,更不会比别人更不努力。你只是按照你能做到的、最适合你自己的办法去实现自己的目标,去成长为你眼中优秀的人们中的一员。
你自己、优秀的人群;决心、视野;自律、标准。
业精于勤,行成于思。
古之成大事者,不惟有超世之才,亦必有坚韧不拔之志。
苟有恒,何必三更起五更眠;最无益,只怕一日曝十日寒。 十五年只做一个行当。
展开
-
NLP-使用Word2vec实现文本分类
将文本转化为向量try:continuereturn vec# 这段代码定义了一个函数 average_vec(text),它接受一个包含多个词的列表 text 作为输入,并返回这些词对应词向量的平均值。该函数# 首先初始化一个形状为 (1, 100) 的全零 numpy 数组来表示平均向量# 然后遍历 text 中的每个词,并尝试从 Word2Vec 模型 w2v 中使用 wv 属性获取其对应的词向量。如果在模型中找到了该词,函数将其向量加到 vec 中。原创 2024-07-23 17:43:49 · 599 阅读 · 0 评论 -
[译]Gensim FastText 模型
此篇为翻译GENSIM官网中有关FastText model的内容。我用自己moke的数据代替原文中的语料做模型训练例子。之前文章介绍过word2vec模型有一个缺陷就是对于词库外的词不能给出向量表示,但是FastText模型可以很好的解决这个问题。FastText模型是Facebook开发的一个向量表征模型,它既支持直接调用,也可以根据自己的业务场景需求自己训练。下面介绍下FastText模型的几种快速启动使用方法。翻译 2024-07-23 11:19:52 · 155 阅读 · 0 评论 -
自训练和增量训练word2vec模型
我们希望通过自己训练业务相关的语料word2vec模型来获得词嵌入、词相关性查询等。根据自己的业务场景准备训练数据,比如用户在商城上的同购行为序列或同浏览行为序列。原创 2024-07-22 17:01:59 · 775 阅读 · 0 评论 -
pyspark使用 graphframes创建和查询图的方法
使用graphframes创建图和查看图数据原创 2024-07-17 20:51:06 · 1036 阅读 · 0 评论 -
使用DeepWalk 和Word2Vec实现单词Embedding
2. 定义并实现一个输入起始点和随机游走步数的函数'''输入起始节点和路径长度,生成随机游走节点序列'''# 汇总邻接节点break# 从邻接节点中随机选择下一个节点# 试着从随机森林出发,采样五个节点。原创 2024-07-12 10:20:10 · 769 阅读 · 0 评论 -
2-Embedding例子:简单NN网络、迁移学习例子(glove语料预训练)
Embedding简单例子原创 2024-04-18 20:23:03 · 414 阅读 · 0 评论 -
3-pytorch数据迁移代码实例:特征提取和微调(基于卷积神经网络retnet18)
在特征提取中,可以在预先训练好的网络结构后修改或添加一个简单的分类器,然后将源任务上预先训练好的网络作为另一个目标任务的特征提取器,只对最后增加的分类器参数进行重新学习,而预先训练好的网络参数不被修改或冻结。实际上,微调要优于特征提取,因为它能够对迁移过来的预训练网络参数进行优化,使其更加适合新的任务。微调的大致过程是在预先训练过的网络上添加新的随机初始化层,此外预先训练的网络参数也会被更新,但会使用较小的学习率以防止预先训练好的参数发生较大改变。常用方法是固定底层的参数,调整一些顶层或具体层的参数。原创 2024-04-22 18:38:19 · 853 阅读 · 0 评论