- 博客(5)
- 收藏
- 关注
原创 利用word2vec训练词向量
利用word2vec训练词向量这里的代码是在pycharm上运行的一、数据预处理我们选用的数据集是新闻数据集一共有五千条新闻数据,一共有四个维度数据集:https://pan.baidu.com/s/14z–kvHYgwDAbgO0dxlHDg 提取码:9a8a首先我们要把我们需要的数据给提取出来,这里我们将数据集里的所有新闻提取出来,并对其进行分词,再删除停用词import pandas as pdimport jieba#读取数据集new_data = pd.read_table("
2021-09-19 10:19:22
8787
14
原创 新闻分类(文本分类)
新闻分类主要使用贝叶斯进行分类numpypandasjiebasklearn1.数据读取首先读取数据,并对数据进行清洗import numpy as npimport pandas as pdnewdata = pd.read_table("数据集路径",names=['label','theme','URL','content'],encoding='utf-8')newdata = df_news.dropna()#删除缺失值#查看数据维度newdata.shape#查
2021-07-05 11:08:58
3023
2
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅