自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(9)
  • 收藏
  • 关注

原创 最大公共字符串,最大公共子序列,编辑距离,myers等算法

前言这个4个算法比较相似,并且有以下相同点和不同点异同点相同点:1、都是在字符串上得到某个目标;2、算法的核心都是动态规划的思想。不同点:1、目标不同,其中最大公共字符串是最大连续的子序列,例如:str1 = "ABCDEF" , str2="ZABCDZE",最大公共字符串是"ABCD",长度为4。而最大公共子序列是"ABCDE",长度为5。2、编辑距离,是求从一个字符串str1到另一个字符串str2的变动的最小次数,其中变动只在一个字符串上发生,变动包括三个动作:删除,插入.

2021-09-24 21:44:05 1515 1

原创 Python中使用sorted函数对dict进行排序

Python中的字典排序参考:菜鸟教程目的:对Python中dict这种类,使用 sorted 函数进行排序的总结,做一个备忘。1错误的排序方式如果直接将dict丢进sorted:key_value={}key_value[2] = 56key_value[1] = 2key_value[5] = 12key_value[4] = 24key_value[6] =...

2020-04-12 18:13:52 5008

原创 NLP文本的表示,从【Bag-of-words】到 【word2vec】

1. Bag-of-words1.1 类似于one-hot的词袋模型 Bag of words模型最初被用在文本分类中,将文档表示成特征矢量。它的基本思想是假定对于一个文本,忽略其词序和语法、句法,仅仅将其看做是一些词汇的集合,而文本中的每个词汇都是独立的。简单说就是将每篇文档都看成一个袋子(因为里面装的都是词汇,所以称为词袋,Bag of words即因此而来),然后根...

2020-03-24 14:45:56 2109

原创 指针生成网络(Pointer-Generator Networks)的实现

指针生成网络的简介指针生成网络(Pointer-Generator Networks)是一个基于seq2seq+attention的生成模型,相比于seq2seq+attention的生成模型,它能够在一定的程度上解决oov(out of vocab)的问题。回顾seq2seq+attenion 这一篇博客有比较详述的解析对于seq2seq+attenti...

2020-03-10 20:26:38 11559 19

原创 Seq2Seq + attention 模型原理、训练,以及编码过程

目录1. 简介2. Seq2Seq2.1 Encoder2.2 Decoder3. Seq2Seq with Attention3.1 Decoder4. Train5. Decoding5.1 理论5.2 实例6 总结1. 简介Seq2Seq的基本结构是encoder-decoder,这个模型的目标是生成一个完整的句子。这个模型曾经使得谷...

2020-01-04 00:45:39 5874 3

原创 python列表推导式和字典推导式语法的细节

列表推导式 和 字典推导式在python中常用,但是有时候经常混淆,语法上也略有区别,随手写下,给自己做个记录列表推导式a = [0,1,2,3,4,5,6,7,8,9]b = [i+100 if i > 5 else 0 for i in a ]print('b : ',b)输出:注意:条件语句在for之前这个顺序能否颠倒呢?a = [0,1,2,3,...

2019-12-26 23:48:22 747 1

原创 基于BERT模型的知识库问答(KBQA)系统

一、知识库KB-QA的介绍参考链接:https://zhuanlan.zhihu.com/p/257355721、什么是知识库“奥巴马出生在火奴鲁鲁。”“姚明是中国人。”“谢霆锋的爸爸是谢贤。”这些就是一条条知识,而把大量的知识汇聚起来就成为了知识库。我们可以在wiki百科,百度百科等百科全书查阅到大量的知识。然而,这些百科全书的知识组建形式是非结构化的自然语言,这样的组织...

2019-11-24 17:36:40 13217 47

原创 决策树的信息增益率解决的信息增益熵的bug

这个例子是李航博士统计统计学习方法的例子,博客的内容是按照自己的理解做一个计算的过程的记录。贷款申请样本数据表 ID 年龄 有工作 有自己的房子 信贷情况 类别 1 青年 否 否 一般 否 2 青年 否 否 好 否 3 青年 是 否 好 是 4 青年...

2018-08-26 21:17:07 566

原创 Anaconda 下载、安装、更改默认工作目录

Anaconda简介:anaconda指的是一个开源的Python发行版本,其包含了conda、Python等180多个科学包及其依赖项。下载:官网速度很慢,容易断线:https://www.anaconda.com/download/            清华镜像:https://mirrors.tuna.tsinghua.edu.cn/anaconda/archive/安装:一路打勾,添加环...

2018-05-19 18:11:50 26493 2

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除