妙空幽明-优快云博客

原创 Python股票盯盘助手

学习股票交易有一段时间了，还未逃脱盯盘的初级阶段，索性写了一段微信盯盘脚本，将账户信息实时发送到微信助手中先导入需要的包 import tushare as ts import itchat, time from itchat.content import TEXT import datetime 登陆微信 itchat.logout() itchat.auto_login(hotR...

2018-11-01 18:32:23 6144 1

问题发现：本次案例为工作中遇到的实际问题，在语音识别中的语料准备部分，需要从网络中爬取相当数量的相关文本，其中发现爬取到了一些不相关的内容，如何把这些不相关的内容剔除掉成为笔者需要思考的问题。初步思考：遇到此问题笔者第一时间考虑是将文本分词后向量化，使用聚类看一下分布情况，然而发现在不同训练集中，训练样本变化时，向量随之变化，在测试集中表现一般，在实测中几乎无用。于是想到向量化的方法问题，使用sk...

2018-06-25 15:46:18 3588

Python盯盘小助手

学习股票交易有一段时间了，还未逃脱盯盘的初级阶段，索性写了一段微信盯盘脚本，将账户信息实时发送到微信助手中

2018-11-01

自然语言处理之文本主题判别

问题发现：本次案例为工作中遇到的实际问题，在语音识别中的语料准备部分，需要从网络中爬取相当数量的相关文本，其中发现爬取到了一些不相关的内容，如何把这些不相关的内容剔除掉成为笔者需要思考的问题。初步思考：遇到此问题笔者第一时间考虑是将文本分词后向量化，使用聚类看一下分布情况，然而发现在不同训练集中，训练样本变化时，向量随之变化，在测试集中表现一般，在实测中几乎无用。于是想到向量化的方法问题，使用sklearn CountVectorizer方法进行向量化，仅仅是将所有词频无序的向量化，看到另外博文时，发现应该先将目标主题的文本进行词频统计，将统计结果当做向量化模板，实测发现效果不错，现将此方法分享给大家

2018-06-25

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

weixin_40662229的博客

原创 Python股票盯盘助手

原创自然语言处理之文本主题判别

Python盯盘小助手

自然语言处理之文本主题判别

空空如也

原创 Python股票盯盘助手

原创 自然语言处理之文本主题判别

Python盯盘小助手

自然语言处理之文本主题判别

空空如也

原创自然语言处理之文本主题判别