搜狗新闻文本分类完整代码/数据集/实验报告

 数据集

http://t.csdnimg.cn/rP6qxicon-default.png?t=N7T8http://t.csdnimg.cn/rP6qx实验报告

http://t.csdnimg.cn/1NuSaicon-default.png?t=N7T8http://t.csdnimg.cn/1NuSa

import os
import re

import pandas as pd
import jieba
import numpy as np
#from keras.src.optimizers import Adam
#from keras.optimizer_v1 import Adam
from tensorflow.keras.optimizers import Adam
from sklearn.feature_extraction.text import TfidfVectorizer, CountVectorizer
from sklearn.model_selection import train_test_split
from sklearn.naive_bayes import MultinomialNB
from sklearn.linear_model import LogisticRegression
from sklearn.metrics import accuracy_score, f1_score, roc_auc_score
from sklearn.svm import SVC
from xgboost import XGBClassifier
from sklearn.preprocessing import LabelEncoder
from wordcloud import WordCloud
import matplotlib.pyplot as plt
import matplotlib
import numpy as np
from keras.models import Sequential
from keras.layers import Dense, LSTM, Embedding, SpatialDropout1D
#from keras.utils import to_categorical
from sklearn.model_selection import train_test_split
from keras.preprocessing.text import Tokenizer
from keras.preprocessing.sequence import pad_sequences
matplotlib.rcParams['font.sans-serif'] = ['SimHei'] #中文字体"SimHei"
matplotlib.rcParams['axes.unicode_minus'] = False  # 解决保存图像是负号'-'显示为方块的问题
from prettytable import PrettyTable
import tensorflow as tf



# 读取数据
data_path = 'CH10data/搜狗文本分类语料库迷你版'  # 更改为你的数据集路径
categories = ['体育', '健康', '军事', '教育',
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值