
自然科学语言
文章平均质量分 51
x_bessie
这个作者很懒,什么都没留下…
展开
-
numpy 数据类型存入数据库中
import numpy as npimport pymysqlprediction = np.array([])mysql_server='localhost'name='root'password='your password'mysql_db='your database'db=pymysql.connect(mysql_server,name,password,mys...原创 2018-10-10 21:50:55 · 2251 阅读 · 0 评论 -
python 长文本分析——testrank
python 文本分析功能:摘取文章词语,重点短语,重点句子环境: pyhton3.6工具库:textrank``jieba``numpy方法介绍(重点):testrank 的算法来自于pagerank说人话就是,先把文章的句子拆分,然后对每一句都标注,对每一句生成一个无向图,然后无向图会有一个相似度的打分,也就是说两个句子有相似性,那么认为这两个句子对应的节点之间存在一条无向有...原创 2018-12-03 16:55:06 · 1982 阅读 · 2 评论 -
NLP之word2vec用法
NLP之word2vec用法导入词向量模型,并查找词的相关性import gensim# 导入模型 #谷歌3.4G#model_path='GoogleNews-vectors-negative300.bin'#斯坦福0.94Gmodel_path='glove.twitter.27B.200d.bin'model = gensim.models.KeyedVectors.loa...原创 2018-12-13 16:44:46 · 332 阅读 · 0 评论 -
安装NLTK库进行数据预处理
安装NLTK,Torch本来是想装一个torchtext用来英文的分词的。但是用这个库的时候,颇为麻烦了。又不能直接pip 安装gayhub:https://github.com/pytorch/text但是,readme.md里面写的几百年前的版本了 QAQ首先要装一个torch,但是报了一个版本错误的提示。我的环境:anaconda5.2.0python3.6.5去官网找到...原创 2018-12-20 10:17:28 · 468 阅读 · 0 评论