- 博客(15)
- 收藏
- 关注

原创 LSTM结构与Elmo网络结构
文章目录一、词的表示二、LSTM概述2.1 标准RNN结构如下(单个tanh层)2.2 lstm 结构图如下2.3 lstm的4层交互结构说明:三、ELMO模型概述3.1 问题引入问题①:红框ELMO内部究竟是啥玩意?问题②:是直接将词输入到ELMO模型吗?问题③:ELMO输出的h1、h2、蓝柱是什么?3.2 ELMO的内部构造图3.3 如何得到输入词的词向量词向量卷积过程示例3.4 loss函数以及最终输出3.4.1 loss函数3.4.2 输出向量表示3.4.3 最终结果计算3.5 ELMO事项说明一
2020-07-03 19:07:00
1635

原创 Word2vec学习笔记(一)
文章目录word2vec 简介常见的word embedding方法模型模型特例(bigram)符号说明计算过程说明损失函数及链式法则关系用梯度下降(GD)推导权重更新方程CBow模型(多词向下文输入)Skip-Gram模型总结说明模型优化层次softmax(hierarchical softmax)结构图结构特点负采样(Negative Sampling)采样公式总结word2vec 简介word2vec 在2013年被Google开源的一种词向量计算的工具(框架). 可在百万级别的词典和亿级别的
2020-06-27 21:07:25
830
原创 常见激活函数概览
常见激活函数概览1、激活函数的用处2、常见激活汇总3、选择合适的激活函数的建议4、常见激活函数图形1、激活函数的用处有助于提取重要信息,过滤不相干信息。不使用激活函数的神经网络本质上是线性回归模型。 该过程其实就是通过加权来影响对应神经元的操作。 公式: y = Activate(∑(wx)+b),这里的输出不一定是最终模型的输出,而是层(layer)的输出。此过程也就是前向传播。(反向传播就是利用经验误差更新参数的过程)2、常见激活汇总激活函数表达式(一阶)导数备注
2021-06-19 16:24:19
224
翻译 pandas文本数据的读写与简单操作
文章目录1.TXT文件读写2.CSV与Excel数据读写3.写入MySQL4.常见DataFrame操作5.数据太大如何读取1.TXT文件读写常用使用open()、write()、readlines()、read()、readline()2.CSV与Excel数据读写read_csv()、to_csv()、to_excel()、to_csv()3.写入MySQLdf.to_sql('20_country', create_engine('mysql+pymysql://root:root@l
2021-02-18 23:49:05
472
原创 (一) KNN---异常行为检测
文章目录一、项目说明linux系统主机安全检测,除了使用系统自带命令简单粗暴检测入侵类型如异常登录、异常网络链接等,对于如恶意命令、rookit等类型的检测,除了基于规则(如设置黑白名单、shell 命令)的方式外,需要进一步使用机器学习辅助检测。本次使用k近邻检测执行异常指令。本次数据使用 http://www.schonlau.net/ 上发布的针对linux操作的训练数据。二、数据初步探索1、查看用户操作命令文件(共计约3M左右)import osuser_50_cmd_li = os.l
2020-08-23 14:58:51
2385
1
原创 numpy常见的数据处理接口
文章目录numpy改:查:运算(data为number型或array型):统计函数(data为number或array):增:numpy改:维度形状:my_arr.reshape(m, n)维度交换:my_arr.transpose(元组) # 根据维度的索引交换顺序:np.random.shuffle(my_arr)类型:my_arr.astype(np.int32)查:普通索引:多维数组:my_arr[1, 1]等效于myarr[1][1],my_arr[1:3,2:
2020-07-25 23:56:31
312
原创 NLP之新闻文本分类实战(一)-EDA
文章目录NLP之新闻文本分类实战(一)-EDA一、背景概述二、评价指标三、数据EDA(数据探索性分析)代码NLP之新闻文本分类实战(一)-EDA一、背景概述 数据为新闻文本,已按照字符级别进行脱敏处理。数据集中一共有14个类别,对应关系为:{‘科技’: 0, ‘股票’: 1, ‘体育’: 2, ‘娱乐’: 3, ‘时政’: 4, ‘社会’: 5, ‘教育’: 6, ‘财经’: 7, ‘家居’: 8, ‘游戏’: 9, ‘房产’: 10, ‘时尚’: 11, ‘彩票’: 12, ‘星座’: 13
2020-07-22 23:56:04
1215
原创 Word2Vec学习笔记(二)
最近在阅读word2vec的经典之作 Xin Rong 论文,学习过程遇到了一些困惑,记录如下。问题一:在特殊模型(“bigram”)结构图上, 计算维度对不上在输入层误把 上图中的x(x1, x2… xv)看成 (V, N)的one-hot向量矩阵,导致误解一:x1 为维度(1, N)的独热编码向量,误解二:把x看成矩阵. 故致使层层之间的维度变换怎么都对应不上, 其原因是高中向量与高等向量的细节问题:前者向量是行向量,后者好像默认是列向量(同济线代),所以考虑美观,平时人为书写向量一般指的是
2020-06-27 20:55:52
238
翻译 python 如何将打包并上传至PyPI
文章目录示例目录结构setup.pyREADME.mdLICENSE生成distribution archives(可分发归档包)上传归档到PyPI网站结束示例目录结构 my_tutorial_dir # 打包入口 |----- LICENSE # **重要, https://choosealicense.com/ |----- README.md # 随意,可连接到github |----- my_package/ # 实际包名,from my_pack
2020-06-18 15:42:10
609
1
原创 linux sed、grep、egrep、find常见实践案例
文章目录sed练习先猜后看grep练习先做后看egrep练习先做后看sed练习先猜后看cat -n /etc/passed | sed '2,5d' # 将2~5行删除后显示cat -n /etc/passwd | sed '2a Hello Friends' # 在第2行后面一行加上"hello friends"字符串 cat -n /etc/passwd | sed '2,4c 自律者自由' # 将第2~5行内容替换成指定串 cat -n /etc/passwd | sed
2020-06-16 20:46:48
321
翻译 python 树的创建与遍历(BFS、DFS)
内容知识点树节点的定义根据列表创建二叉树二叉树的遍历前序、中序、后序、层次遍历(完整代码如下)树节点的定义class TreeNode: def __init__(self, x): self.val = x self.left = None self.right = None根据列表创建二叉树def create_tree(root, array, i): if i < len(array): if array
2020-05-13 21:53:08
677
原创 使用scrapy框架爬腾讯网时向其中引入 Queue模块所遇到问题
最近工作有点愉快, 终于对python scrapy爬虫框架用到吐血,并不是对这个框架功能彻底用透了, 而是对一下普通流水性代码的重复已经腻无力吐槽, 于是慢慢往框架中加入不一样使用方式. 本次博文是在使用scrapy框架爬取腾讯网新闻, 手动加入自定义的队列(from queue import Queue) , 用来保存url请求字符串的字典参数, ...
2018-10-29 16:34:24
419
原创 简单自实现scrapy爬虫的框架yield 数据处理
功能描述:捕获yield数据, 如果是字典对象或数据类型, 打印该信息;如果是请求对象,则发送该请求并打印响应结果实现关键: 装饰器coding=utf-8import requestsimport urllib.requestimport urllibname_list = [‘zhangsan’, ‘lisi’, ‘wangwu’, ‘zhaoliu’]age_list = [2...
2018-10-26 15:59:08
696
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人