- 博客(7)
- 收藏
- 关注
原创 Skip-gram预习
假设词汇表有个词,而词向量的维度为。Skip-gram的基本目标是通过优化一个目标函数来训练词向量,使得模型能够从中心词预测上下文词。
2025-01-22 20:17:31
319
原创 Continuous Bag of Words CBOW预习(原理,步骤与简单例子)
CBOW(Continuous Bag of Words)是一种常用于训练词向量的模型,属于方法中的一种架构。它的核心思想是给定上下文(周围的词),预测中心词(目标词)。与 Skip-gram 相对,CBOW 模型是通过上下文预测中心词。CBOW 模型假设:如果知道一个词周围的上下文词,那么可以用这些上下文词来预测该词。:模型接受上下文词作为输入。假设给定一个中心词和它周围的上下文词,CBOW 会尝试利用这些上下文词来预测中心词。
2025-01-20 22:21:33
1951
原创 结构化数据、非结构化数据、半结构化数据
结构化数据是指完全按照预定义模式存储和组织的数据,通常存储在行列形式的关系型数据库中,每一行代表一条记录,每一列代表一个字段。半结构化数据部分具有结构化的特性,但没有严格的固定格式或关系,数据通过标签、标记或键值对的方式表示内容和关系。非结构化数据是完全没有固定格式的数据,通常以文本、图像、音频、视频等多种形式存在,无法用表格的方式轻松组织。特性结构化数据半结构化数据非结构化数据格式严格固定的行列关系部分结构化,灵活性强无固定格式,多样化形式存储形式关系型数据库。
2025-01-15 15:23:25
1943
原创 bit、byte、int、float、内存、显卡内存之如何根据title简单估算一个大语言模型参数存储到底需要多大显卡内存及内存
自用。nlp课后作业整理。
2025-01-15 13:00:12
1712
原创 常用距离公式总结
两点之间的直线距离,是最常用的距离测量方法两点在个维度上的绝对差的累加,也称为L1距离向量间夹角的余弦值,用于衡量方向的差异两点在各维度的最大绝对差距,也称为距离考虑数据分布和特征相关性的距离度量欧几里得距离和曼哈顿距离的广义形式两个等长字符串对应位置不相同的字符个数集合间的不相似性度量,即交集与并集之差的比例。
2025-01-14 23:11:49
442
原创 NLP任务形式简单总结
将文本归类到一个或多个预定义类别中针对两句/段文本,判断它们之间是否存在推理关系针对文本的某一区间或位置,输出对应的结果针对句子中的每个单词或标记,输出一个类别根据输入生成新的文本内容。
2025-01-14 22:35:43
222
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人