
自然语言
文章平均质量分 78
weixin_38092754
这个作者很懒,什么都没留下…
展开
-
每日新闻预测金融市场的变化_版本1
数据来源于国外的网站,类似于国内的贴吧网站### RedditNews.csv: two columns The first column is the "date", and second column is the "news headlines". All news are ranked from top to bottom based on how hot they are. Hen原创 2017-10-30 13:33:22 · 911 阅读 · 1 评论 -
每日新闻预测金融市场的变化_版本2
######加载包#####from sklearn.feature_extraction.text import CountVectorizer,TfidfVectorizerimport pandas as pdimport numpy as npfrom sklearn.svm import SVCfrom sklearn.metrics import roc_auc_score原创 2017-10-30 14:21:01 · 690 阅读 · 0 评论 -
利用每日新闻预测金融市场的变化_版本3
之前两个版本未使用word2vec,word2vec是自然语言处理的神器 接下来,看代码import pandas as pdimport numpy as npfrom sklearn.metrics import roc_auc_scorefrom datetime import dateimport os导入数据#####导入数据######os.chdir(r'D:/原创 2017-10-31 08:20:51 · 962 阅读 · 0 评论 -
关键词搜索
本文是Kaggle 竞赛题 Home Depot Product Search Relevance######加载包#####from sklearn.ensemble import RandomForestRegressor,BaggingRegressorimport pandas as pdimport numpy as npfrom nltk.stem.snowball i原创 2017-10-31 08:50:44 · 393 阅读 · 0 评论 -
关键词搜索版本2
# -*- coding: utf-8 -*-"""Created on Tue Oct 31 09:56:19 2017@author: czw"""#导入包import numpy as npimport pandas as pdfrom sklearn.ensemble import RandomForestRegressor,BaggingRegressorfrom n原创 2017-10-31 14:12:41 · 386 阅读 · 0 评论 -
主题模型lda使用
import pymysqlfrom sklearn.feature_extraction.text import TfidfVectorizer,CountVectorizerfrom sklearn.decomposition import LatentDirichletAllocationimport jiebaimport ldaimport numpy as npdef m原创 2017-12-06 20:21:23 · 1167 阅读 · 5 评论