AI写算法：TF-IDF

最新推荐文章于 2025-04-27 16:33:21 发布

军哥说AI

最新推荐文章于 2025-04-27 16:33:21 发布

阅读量317

点赞数 6

CC 4.0 BY-SA版权

分类专栏： AI写算法文章标签：人工智能 tf-idf

本文链接：https://blog.youkuaiyun.com/class4715/article/details/139044731

以下是一个使用Python和sklearn库中的TfidfVectorizer类来实现TF-IDF（Term Frequency-Inverse Document Frequency）的简单示例。TfidfVectorizer是一个将原始文本转换为TF-IDF特征向量的转换器。

python复制代码

	`# 导入必要的库`
	`from sklearn.feature_extraction.text import TfidfVectorizer`
	`from sklearn.datasets import fetch_20newsgroups`

	`# 加载数据集（这里我们使用20 Newsgroups数据集作为示例）`
	`categories = ['alt.atheism', 'talk.religion.misc', 'comp.graphics', 'sci.med']`
	`newsgroups_train = fetch_20newsgroups(subset='train', categories=categories, shuffle=True, random_state=42)`