
传统统计机器学习算法
文章平均质量分 61
光英的记忆
新世界,新创造
展开
-
python 和Java使用模数、公钥指数、私钥指数进行RSA加解密 分别实现
python版本模数 指数#!/usr/bin/pythonimport sysfrom binascii import a2b_hex, b2a_hexfrom Crypto.PublicKey import RSAfrom Crypto.Cipher import PKCS1_v1_5from Crypto.Util.number import bytes_to_longdef encrypt_with_modulus(content, modulus=None): e.原创 2021-01-06 11:25:17 · 913 阅读 · 1 评论 -
linux安装fasttext失败问题解决,RuntimeError: Unsupported compiler -- at least C++0x support is needed!
RuntimeError: Unsupported compiler -- at least C++0x support is needed!主要报错信息 ERROR: Command errored out with exit status 1: command: /root/anaconda3/envs/torch13/bin/python -u -c 'import s...原创 2019-12-13 11:04:56 · 3019 阅读 · 1 评论 -
hmm进行英文词性标注
这里采用的手写维特比算法进行词性标注我们也可以选择第三方的库进行计算https://github.com/jmschrei/yahmmimport nltkimport sysfrom nltk.corpus import brown"""做这个之前 首先我们要知道 我们知道什么 要求什么第一步我们需要根据 给定的语料库 进行学习hmm模型的...原创 2019-12-01 20:51:11 · 960 阅读 · 0 评论 -
gensim的LDA做文档主题分类的练习 模型加载和预测
主题模型是个无监督的学习方法这里简单记录一下 用Gensim的lda 进行文档进行主题模型分类的一个小小的练习及其 预测可以简单理解 lda就是训练2个分布 一个是文档到主题的分布概率 和主题到单词的分布概率 文档到单词的分布概率是一直的不断挑战预期具体理论细节可以参考这篇博客https://blog.youkuaiyun.com/v_july_v/article/detail...原创 2019-11-28 21:13:14 · 5177 阅读 · 1 评论 -
贝叶斯做语种检测,模型保存和加载预测
from sklearn.feature_extraction.text import CountVectorizerfrom sklearn.model_selection import train_test_splitfrom sklearn.naive_bayes import MultinomialNBimport refrom sklearn.externals import...原创 2019-11-24 21:17:01 · 694 阅读 · 0 评论 -
贝叶斯做文本分类,代码实现数据处理
import osimport timeimport randomimport jieba #处理中文import nltk # 处理英文import sklearnfrom sklearn.naive_bayes import MultinomialNB #多项式模式贝叶斯 还有伯努利模式 混合模式import numpy as npimport pylab as p...原创 2019-11-24 20:32:19 · 1006 阅读 · 2 评论 -
朴素贝叶斯公式的理解和应用
朴素贝叶斯2019.11.211. 引言贝叶斯方法是一个历史悠久,有着坚实的理论基础的方法,同时处理很多问题时直接而又高效,很多高级自然语言处理模型也可以从它演化而来。因此,学习贝叶斯方法,是研究自然语言处理问题的一个非常好的切入口。2. 贝叶斯公式贝叶斯公式就一行:而它其实是由以下的联合概率公式推导出来:其中P(Y)叫做先验概率,P(X|Y)叫做后验概率,P(...原创 2019-11-21 11:33:25 · 555 阅读 · 0 评论