
NLP项目实践
文章平均质量分 93
各类NLP相关算法的实践
算法驯化师
1. 多年面试官经验、欢迎咨询各类简历修改、面试经验、求职准备、项目包装、项目指导(算法代码方向);
2. 混迹多个大厂搜索、推荐、广告、内容、数据挖掘、数据分析等多个岗位工作,目前大模型算法驯化师;
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
【NLP实战-BERT文本分类】一文搞懂基于BERT进行文本分类并定制化评估指标
文本分类任务的目标是将文本数据分配到预定义的类别中。在本次项目中,我们使用了一个包含用户评论和评价维度的数据集。数据集中的每条评论都对应一个评价维度(如“服务态度”、“产品质量”等),我们的目标是训练一个模型,能够自动根据评论内容预测其对应的评价维度。原创 2025-02-07 17:09:32 · 1091 阅读 · 0 评论 -
【Transforms-驯化】一个通过seq2seq和Transforms实现文本生成的例子
文本生成目前都是通过gpt等大模型进行完成,本次介绍一下通过seq2sep以及Transforms来实现。原创 2024-12-17 11:43:53 · 375 阅读 · 0 评论 -
【NLP项目-01】手把手教你基于TF-IDF提取向量+贝叶斯或者随机森林进行文本分类
文本分类是自然语言处理(NLP)中的一项基础任务,其目标是将文本数据自动归类到预定义的类别中。TF-IDF(Term Frequency-Inverse Document Frequency)是一种常用的文本向量化方法,它能够衡量一个词语对于一个文档集或一个语料库中的其中一份文档的重要性。作用:用来计算一个词在文档中的权重大小,通常用来计算词权重方法之一TF:一个词在文档中的频次IDF:逆文档频率,一个关键词w在dw个文档中出现的次数TFijnij∑knkjTFi。原创 2024-06-17 21:12:11 · 2041 阅读 · 0 评论