python开源库(nlp方向)

本文介绍Gensim和Fancy-NLP两大工具。Gensim用于主题模型和文本相似度计算,支持TF-IDF、LSA、LDA及word2vec等算法;Fancy-NLP为腾讯团队开发,支持实体提取、文本分类等功能,适用于商品画像构建。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

1、Gensim:主题模型,计算文本相似度

官网:https://radimrehurek.com/gensim/

学习教程:https://www.cnblogs.com/iloveai/p/gensim_tutorial.html

pip install gensim

(1)用于从原始的非结构化的文本中,无监督地学习到文本隐层的主题向量表达,支持包括TF-IDF,LSA,LDA,和word2vec在内的多种主题模型算法

(2)支持流式训练,并提供了诸如相似度计算,信息检索等一些常用任务的API接口

2、Fancy-NLP:是腾讯商品广告策略组团队构建的,用于建设商品画像文本知识挖掘工具,支持如:实体提取、文本分类和文本相似度匹配等多种常见nlp任务。能够支持用户快速实现相关功能,比如说快速挖掘商品特征,应用到支持广告商品推荐模块种。

pip install fancy-nlp
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值