P104-105代码中变量之间的关系

本文介绍使用CountVectorizer及TfidfVectorizer进行文本特征提取的方法,并结合贝叶斯分类器进行训练与预测的过程。具体包括从原始数据转换为特征向量,再利用这些向量训练模型并进行测试。
X_train =>X_count_filter_train(CountVectorizer)
X_test  =>X_count_filter_test(CountVectorizer)


X_train=>X_tdifdf_filter_train(TfidVectorizer)
X_test=>X_tdifdf_filter_test(TfidVectorizer)




X_count_filter_train=>(建立模型)y_train(CountVectorizer+贝叶斯分类器)
X_count_filter_test=>(预测)y_count_filter_predict(CountVectorizer+贝叶斯分类器)


X_tfidf_filter_train=>(建立模型)y_train(TfidfVectorizer+贝叶斯分类器)
X_tfidf_filter_test=>(预测)y_tfidf_predict(TfidfVectorizer+贝叶斯分类器)
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值