
我的文档
文章平均质量分 64
阿宣22
这个作者很懒,什么都没留下…
展开
-
网络安全略谈——你的密码是否安全?
最近一直都在学习网络安全方面的知识,也使用wireshark抓了一些报文仔细观察了一下。对于网络安全有了更多的了解,于是便在这儿和大家分享一下。当我们打开一个网页,登陆的时候,或者cookie直接帮我们登陆的时候,我们的密码或者密码相关的信息就会被发送到另一个服务器接受验证。于是问题就产生了:可能一个不怀好意的人正在偷听你和另一台服务器的谈话——包括你的密码。 究竟什么是秘密?原创 2014-03-23 03:54:06 · 1086 阅读 · 0 评论 -
小样本分析(二)
东西写好之后,确认了几件事情,今天拿出来水一下。公式这个真是麻烦死了,markDown也不好用,只好把word里面的公式都去掉,重新写一点。引子: 一个暗盒子里面装满了球(认为足够多),拿出一个球发现是红球,再拿出一个还是红球的概率是多少?小样本分析主要回答的就是这一类问题。在以前的遇到这些问题时往往会以抽样样本数量太少不具备统计学意义为理由,拒绝回答这类“没有意义”的问题原创 2015-07-21 07:50:21 · 3813 阅读 · 2 评论 -
数据挖掘的若干问题
设计VS训练:博数据VS原创 2014-11-24 12:32:45 · 691 阅读 · 0 评论 -
小样本时的概率估算
本文严重参考了《Foundations of Statistical Natural Language Processing》和《MaximumEntropy Language with Non-Local Dependencies》(吴军);侵权则删。本文本着传播信息的不失真的理念,主要对其中的知识进行了原封不动的诠释,并无其他改变。(编辑公式太坑了,直接从word上截图的,大家凑合一下)原创 2015-07-06 09:09:42 · 2290 阅读 · 1 评论 -
正则匹配问题(power8竞赛敏感词过滤)
这个赛事我是写了一个,python单线程60秒左右,虽然不知道别人3秒是怎么做的,但是论复杂度,这的方法已经是线性时间复杂度了,所以这里写个分享,供大家指正。线性复杂度:这里所说的线性复杂度指的是和需要匹配的敏感词(主要是简单的模糊匹配)数量无关,只与需要匹配的文本线性相关。如果你已经做到了这一点可以了解一下别人的方法,如果没做到,也可以参考一下本文的方法。这一方法的主要特点是把所有敏感词同时原创 2015-01-24 16:19:49 · 2285 阅读 · 0 评论 -
强规则
外传:最近我在《统计自然语言处理基础》中看到的一个处理概率的问题,和我之前想的有相同之处:利用贝叶斯理论,但是原假设上我们确不同。感新区的朋友可以去看看该书的2.1.10 贝叶斯统计章节。什么是强规则?顾名思义,强规则就是很强的规则,一般来说就是指凌驾于一切规则之上的规则,他是最基础、最本质、最接近真理的规则。强规则是什么?由于本人术业所限,自然就是指机器学习这一块的强规则。本原创 2015-05-06 11:12:23 · 2366 阅读 · 0 评论 -
误差的时空域转化
前言:这是一个简单的问题原创 2014-11-16 16:21:04 · 856 阅读 · 0 评论 -
HASH 与 随机数
本文主要介绍hash与多值原创 2014-05-17 17:00:29 · 13244 阅读 · 2 评论 -
社交网络分析之网络分解(小世界划分)
略谈社交网络:原创 2014-11-03 22:42:26 · 4867 阅读 · 0 评论 -
hash 与 随机数(二)
__author__ = 'axuanwu'import Mcardcard = Mcard.Mcard()# card.setbase()card.set_card(8000)for i in xrange(1, 2001): if i == 999: card.update_card('999') else: card.update_原创 2015-01-27 12:54:02 · 1668 阅读 · 0 评论 -
中文分词之姓名标注
中科院中文分词系统ICTCLAS之人名识别词典分析原创 2014-06-28 05:07:53 · 4912 阅读 · 1 评论 -
数据理想国
0. 絮前些阵子去听了一个和大数据有关的会议,发言人中有两拨:第一拨人:极力宣扬大数据的威力,用各种案例来阐述大数据的高深莫测。第二拨人:在说大数据之前,和大数据划清界限。就像是对待伪科学一样谨慎。至于是非善恶咱就不掺合,我只负责打工。不过有一点是比较明确地:大数据时代尚处在成长期。倘若眼里看到的是20年后(或许只有10年)成熟期的大数据时代,我倒是以为:怎么吹嘘都不为过。突然想原创 2016-01-31 16:16:12 · 837 阅读 · 0 评论