
机器学习
python3.6版本下,对机器学习相关的包的学习
妄语之人
这个作者很懒,什么都没留下…
展开
-
基于蜜罐搜集到的网络数据训练的随机森林模型
数据处理大部分网络数据项可以分成几个类别,因此在数据预处理阶段的大致思路就是将复杂的字符串信息转化为几个类别,其中主要研究了两个特征attack_connection.payload.data_hex和message前者是网络通讯过程中传输的十六进制数据,经过对十六进制数据进行ASCII编码,得到可阅读的报文信息,经过研究发现其中存在攻击嫌疑的报文包含:图谋不轨的cookie、用户匿名、提到b...原创 2020-02-18 23:32:53 · 519 阅读 · 0 评论 -
sklearn-决策树学习笔记
课程资源 : 传送门编程软件: VScode编程语言: python3.6.6基本概念熵:描述不确定性的数学量,不确定性越大熵值越大信息增益:表示特性X使得类Y的不确定性减少的程度,可以用熵值的变化来描述GINI系数: 和熵值的衡量标准类似,计算防止不同:Gini(p)=1−∑k=1Kpk2Gini(p) = 1- \sum_{k=1}^{K} p_k^2Gini(p)=1...原创 2020-02-14 17:07:24 · 229 阅读 · 1 评论 -
tensorflow学习笔记(五)
数据处理date,由于数据集中在九月5日,只有950例在6日,相对于15000+的数据来说,容量太小,因此选择放弃记录日期,只记录时分秒。id:统计发现,几乎每一例记录都存在一个唯一的id,应该属于随机生成的部分,因此选择放弃_index ,alert.action alert.category,alert.gid,alert.signature,alert.severity,a...原创 2020-02-05 19:43:36 · 275 阅读 · 0 评论 -
tensorflow学习笔记(四)
过拟合当模型在训练数据上表现得很好,但是在测试数据上表现不佳的时候,说明发生了过拟合,欠拟合则是模型在任一数据集上的表现都不佳。一般通过在模型中添加Dropout层来防止过拟合的出现Dropout层表示在上一层的输出中丢弃一部分节点,然后在输入到下一层。在没有Dropout层时,相同的数据集来进行训练五个不同的神经网络,一般会得到五个不同的结果,但是经过随机丢弃之后,结果会变的泛化。同时...原创 2020-02-04 19:24:20 · 165 阅读 · 0 评论 -
tensorflow学习笔记(三)
模型优化热度编码制作一个0-9十分类的模型,label值直接写作0-9指序列格式,独热编码则是创建一个长度为10的矩阵,通过矩阵中每个元素的不同来描述(0-1的概率)代码如下:import tensorflow as tf import pandas as pdimport matplotlib.pyplot as pltimport os print("Tensorflow v...原创 2020-02-03 17:36:50 · 207 阅读 · 0 评论 -
tensorflow学习笔记(二)
逻辑回归与线性回归先罗列一下编译环境以及教程来源:编译程序: VScodepython版本:3.6.6Anaconda版本:Anaconda3-2019-10tensorflow版本:2.0.0pandas版本:0.25.1逻辑回归输出的值是简单的是与否,使用sigmoid激活函数将输出的结果映射到0-1之间,输出一个概率值。逻辑回归的损失函数,平方差损失函数惩罚的是损失为同一数量...原创 2020-02-02 17:49:59 · 173 阅读 · 0 评论 -
tensorflow学习笔记(一)
None第一个维度是样本的维度原创 2020-02-01 16:34:51 · 273 阅读 · 0 评论