
算法卡片
文章平均质量分 72
NLP_victor
这个作者很懒,什么都没留下…
展开
-
PTM学习笔记
1、ALbert原创 2020-10-22 23:21:11 · 1175 阅读 · 0 评论 -
检索式对话学习笔记
1、文本相似度编辑距离https://blog.youkuaiyun.com/wxgxgp/article/details/104184418import Levenshteinhttps://blog.youkuaiyun.com/IOT_victor/article/details/106670275simhashhttps://blog.youkuaiyun.com/wxgxgp/article/details/104106867余弦相似度https://blog.youkuaiyun.com/wxgxgp/articl...原创 2020-10-22 22:29:09 · 1334 阅读 · 0 评论 -
BERT应用篇笔记
1、QAQA应用Bert,从流程角度,一般分为两个阶段:检索+QA问答判断。首先往往会把比较长的文档切割成段落或者句子n-gram构成的语言片段,这些片段俗称Passage,然后利用搜索里的倒排索引建立快速查询机制。 第一个阶段是检索阶段,这个和常规的搜索过程相同,一般是使用BM25模型(或者BM25+RM3等技术)根据问句查询可能的答案所在候选段落或者句子; 第二个阶段是问答判断。在训练模型的时候,使用SQuAD等比较大的问答数据集,或者手上的任务自有数据集,对Bert模型进行 Fine-tu原创 2020-09-12 11:48:37 · 876 阅读 · 0 评论 -
推荐系统学习笔记
推荐系统技术演进趋势:从召回到排序再到重排https://zhuanlan.zhihu.com/p/100019681四个环节分别是:召回、粗排、精排和重排。可以在召回和精排之间加入一个粗排环节,通过少量用户和物品特征,简单模型,来对召回的结果进行个粗略的排序,在保证一定精准的前提下,进一步减少往后传送的物品数量,粗排往往是可选的,可用可不同,跟场景有关。 之后,是精排环节,使用你能想到的任何特征,可以上你能承受速度极限的复杂模型,尽量精准地对物品进行个性化排序。 排序完成后,传给重排环节,原创 2020-09-10 18:32:32 · 538 阅读 · 0 评论 -
DSSM学习笔记
PaperWeekly 第37期 | 论文盘点:检索式问答系统的语义匹配模型(神经网络篇):https://zhuanlan.zhihu.com/p/26879507【第九期】AI Talk:深度文本匹配在智能客服中的应用:https://zhuanlan.zhihu.com/p/47336836原创 2020-07-03 15:29:47 · 1717 阅读 · 0 评论 -
BiLSTM-CRF学习笔记
1、模型详解(TF):https://zhuanlan.zhihu.com/p/47722475https://github.com/Determined22/zh-NER-TF(torch): https://github.com/luopeixiang/named_entity_recognition原创 2020-07-03 15:27:12 · 795 阅读 · 0 评论 -
堆排序(Python)
1、堆堆是一个完全二叉树。 堆中每一个节点的值都必须大于等于(或小于等于)其子树中每个节点的值。2、堆的操作2.1、往堆中插入一个元素堆化(heapify)下图是从下往上的堆化,在结尾插入一个元素222.2、删除堆顶元素删除堆顶的元素之后,把最后一个节点放到堆顶,然后利用同样的父子节点对比方法。3、堆排序借助于堆这种数据结构实现的排序算法,就叫作堆...原创 2019-12-18 20:46:06 · 441 阅读 · 0 评论 -
冒泡排序、插入排序与选择排序(Python)
1、冒泡排序冒泡排序只会操作相邻的两个数据。 每次冒泡操作都会对相邻的两个元素进行比较,看是否满足大小关系要求。如果不满足就让它俩互换。 一次冒泡会让至少一个元素移动到它应该在的位置,重复 n 次,就完成了 n 个数据的排序工作。第一次冒泡操作的详细过程经过一次冒泡操作之后,6 这个元素已经存储在正确的位置上。要想完成所有数据的排序,我们只要进行 6 次这样的冒泡操作就行了。...原创 2019-06-11 21:52:11 · 1252 阅读 · 0 评论 -
二分查找及其变体(Python)
1、Binary Search算法简介二分查找,它的时间复杂度是 O(logn)。 其核心思想有点类似分治思想。即每次都通过跟区间中的中间元素对比,将待查找的区间缩小为一半,直到找到要查找的元素,或者区间被缩小为 0。但是二分查找的代码实现比较容易写错。你需要着重掌握它的三个容易出错的地方:循环退出条件、mid 的取值,low 和 high 的更新。 二分查找虽然性能比较优秀,...原创 2019-06-09 21:02:56 · 388 阅读 · 0 评论 -
快速排序(Python)
1、快速排序思路(拓:O(n) 时间复杂度内求无序数组中的第 K 大元素)根据分治、分区、递归的处理思想,我们可以用递归排序下标从 low到 m-1 之间的数据 和下标从 m+1 到 high之间的数据 ,直到区间缩小为 1,就说明所有的数据都有序了。核心思想就是写一个分区函数partition(),返回分区点的下标位置,使分区点左侧的数小于pivot,右侧的值大于pivot...原创 2019-06-09 17:14:14 · 292 阅读 · 0 评论 -
归并排序(Python)
1、归并排序思想归并排序的核心思想:如果要排序一个数组,我们先把数组从中间分成前后两部分,然后对前后两部分分别排序,再将排好序的两部分合并在一起,这样整个数组就都有序了。归并排序的执行效率与要排序的原始数组的有序程度无关,所以其时间复杂度是非常稳定的,不管是最好情况、最坏情况,还是平均情况,时间复杂度都是 O(nlogn)。空间复杂度是 O(n)。2、代码详解(合并函数mer...原创 2019-03-11 21:03:22 · 409 阅读 · 0 评论