模型特征添加与股票市场预测:从理论到实践
1. 模型特征添加
在构建模型时,为了提升其性能,我们可以尝试添加新的特征。首先,我们考虑添加单词计数特征,使用 CountVectorizer 来完成这一操作。具体步骤如下:
from sklearn.feature_extraction.text import CountVectorizer
vect = CountVectorizer(ngram_range=(1,3))
X_titles_all = vect.fit_transform(all_data['title'])
X_titles_train = X_titles_all[train_index]
X_titles_test = X_titles_all[test_index]
X_test = pd.merge(X_test, pd.DataFrame(X_titles_test.toarray(), index=X_test.index), left_index=True)
X_train = pd.merge(X_train, pd.DataFrame(X_titles_train.toarray(), index=X_train.index), left_index=True)
上述代码将现有的特征与新的 n - gram 特征进行了合并。接下来,我们训练模型并查看是否有改进:
clf.fit(X_train, y_train)
y_pred = clf.pre
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



