- 博客(15)
- 收藏
- 关注
原创 命令注入
命令:这里指的是操作系统的命令命令注入:通过web程序,在服务器上拼接系统命令。命令注入流程:是否调用系统命令函数或函数的参数是否可控是否拼接注入命令low等级正常情况下,是ping一个IP地址。确定调用系统命令确定可控字段确定命令语句,&&可以连接两条Windows命令验证medium等级一个&也可以...
2018-09-02 18:12:11
6559
1
原创 跨站脚本(XSS)攻击
什么是XSS全称:Cross Site Script(跨站脚本) 为了与层叠样式表css区分,将跨站脚本简写为XSS 危害:盗取用户信息、钓鱼、制造蠕虫等。概念:黑客通过“HTML注入”篡改网页,插入了恶意脚本,当用户在浏览网页时,实现控制用户浏览器行为的一种攻击方式。XSS分类存储型反射型DOM型...
2018-08-12 00:39:34
19687
4
原创 OpenAI Gym构建自定义强化学习环境
OpenAI Gym由两部分组成:gym开源库:测试问题的集合。当你测试增强学习的时候,测试问题就是环境,比如机器人玩游戏,环境的集合就是游戏的画面。这些环境有一个公共的接口,允许用户设计通用的算法。 OpenAI Gym服务。提供一个站点(比如对于游戏cartpole-v0:https://gym.openai.com/envs/CartPole-v0)和api,允许用户对他们的测试结果进...
2018-07-01 20:55:27
38188
25
原创 机器学习之混合类型数据的使用
在机器学习中,不同类型的数据(numeric, categorical, Continuous and Text data)的混合使用,一直是机器学习中数据处理的难点,处理的方式可能对模型的效果产生重要的影响。神经网络很强大,但是也没办法直接处理类别型的变量,需要经过如one-hot编码的预处理之后才能放进网络去训练。Understanding Categorical Data类别...
2018-05-22 21:15:37
11272
2
原创 提升方法之AdaBoost
对于一个复杂任务来说,将多个专家的判断进行适当的综合所得出的判断,要比其中任何一个专家单独的判断好。实际上就是“三个臭皮匠顶个诸葛亮”的道理。提升方法中最具代表性的算法是AdaBoost。
2018-05-03 15:58:07
354
原创 孤立森林(Isolation Forest)
背景现有的异常检测方法主要是通过对正常样本的描述,给出一个正常样本在特征空间中的区域,对于不在这个区域中的样本,视为异常。这些方法的主要缺点是,异常检测器只是正常样本的最优描述,但是对于检测异常并不是最优的,有可能造成大量的误报,或者只检测到少量的异常。异常的两个特点:异常数据只占很少量、异常数据特征值和正常数据差别很大。孤立森林,不再是描述正常的样本点,而是要孤立异常点,由周志华教授...
2018-05-01 22:26:04
91683
26
原创 强化学习(Reinforcement Learning)
背景当我们思考学习的本质时,我们首先想到的可能是我们通过与环境的互动来学习。无论是在学习开车还是在交谈,我们都清楚地意识到环境是如何回应我们的行为的,我们试图通过行为来影响后续发生的事情。从互动中学习几乎是所有智能系统的理论基础。Reinforcement learning 是机器学习里面的一个分支,善于控制一个能够在某个环境下 自主行动 的个体,通过和 环境 之间的互动,不断改进它的 行为。强化学
2018-03-12 23:31:34
32799
原创 Centos6.5安装mariadb-10.2.12
创建mysql组和用户[root@test local]# groupadd mysql[root@test local]# useradd -g mysql mysql解压/usr/local目录下的mariadb-10.2.12-linux-x86_64.tar.gz[root@test local]# tar -zxvf mariadb-10.2.12-linux-x86_64.tar.gz
2018-01-14 21:43:36
947
原创 Semi-Supervised Support Vector Machines(S3VMs)
对于Semi-Supervised Support Vector Machines (S3VMs),即半监督支持向量机的直观理解是很简单的,如下图所示。在左图中,所有的数据都是有标签数据,所以可以使用SVM的最大化间隔来确定分离超平面。如果存在大量无标记的点,如右图所示,该如何确定分离超平面呢?如果还是采用左图所示的分离超平面,则分离超平面会将稠密的无标记数据切分成两个不同的类。但是根据图上的数据分
2018-01-10 10:44:36
3409
原创 Semi-Supervised Learning
简介半监督学习算法Self-Training ModelsMixture Models and EM有监督分类的混合模型半监督分类的混合模型EM算法求解THE ASSUMPTIONS OF MIXTURE MODELSCLUSTER-THEN-LABEL METHODSCo-Training协同训练THE ASSUMPTIONS OF CO-TRAININGGraph
2017-12-08 18:05:46
1820
翻译 word2vec
word2vec模型是由Mikolov于2013年提出的。由word2vec模型学习的单词向量已经被证明具有语义的意义,并且在各种NLP任务中都很有用。当提到word2vec算法或模型的时候,指的是其背后用于计算word vector的CBoW模型和Skip-gram模型,它们只是浅层神经网络,并不是深度学习算法。本文主要介绍原始的continuous bag-of-word(CBOW)和skip-
2017-11-21 00:12:20
772
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人