- 博客(22)
- 收藏
- 关注
原创 Que2Search: Fast and Accurate Query and Document Understanding for Search at Facebook论文笔记
0、论文资料论文地址:Que2Search: Fast and Accurate Query and Document Understanding for Search at Facebook | Proceedings of the 27th ACM SIGKDD Conference on Knowledge Discovery & Data Mining1、摘要 提出Que2Search,利用多任务和多模态训练方法,学习query和product的表征,在召回阶段召回qu..
2021-10-03 20:55:10
1058
转载 彻底搞懂 python 中文乱码问题
前言曾几何时 Python 中文乱码的问题困扰了我很多很多年,每次出现中文乱码都要去网上搜索答案,虽然解决了当时遇到的问题但下次出现乱码的时候又会懵逼,究其原因还是知其然不知其所以然。现在有的小伙伴为了躲避中文乱码的问题甚至代码中不使用中文,注释和提示都用英文,我曾经也这样干过,但这并不是解决问题,而是逃避问题,今天我们一起彻底解决 Python 中文乱码的问题。基础知识ASCII很久很久以前,有一群人,他们决定用8个可以开合的晶体管来组合成不同的状态,以表示世界上的万物。他们看到8个开关状态
2021-07-25 22:27:22
2546
原创 win10+tensorflow+cuda9.0+cudnn7+GTX960安装教程以及填坑过程
1、先查看电脑显卡支持的CUDA版本 (1)打开NVIDIA控制面板(点击鼠标右键就能找到)2、查看CUDA对应的cudnn、tensorflow和python版本3、安装CUDA和Cudnn及配置环境为了方便,我把cuda9.0和cudnn7放在网盘链接:https://pan.baidu.com/s/1kx-uhNSLukQmou1-Z6js-w...
2019-10-29 17:35:00
2168
1
转载 机器学习优化算法中梯度下降,牛顿法和拟牛顿法的优缺点详细介绍
1、梯度下降法梯度下降法实现简单,当目标函数是凸函数时,梯度下降法的解是全局解。一般情况下,其解不保证是全局最优解,梯度下降法的速度也未必是最快的。梯度下降法的优化思想:用当前位置负梯度方向作为搜索方向,因为该方向为当前位置的最快下降方向,所以也被称为是”最速下降法“。最速下降法越接近目标值,步长越小,前进越慢。缺点:靠近极小值时收敛速度减慢,求解需要很多次的迭代;直线搜...
2019-08-12 09:30:42
13375
原创 用最少数量的箭引爆气球
/*思考:首先将样例画图,找出规律理解题意,其次举例子,1个气球最少用1个箭,2个重叠气球最少用一个箭,3个重叠气球最少用一个箭因此,尽量使气球重叠部分最多一些,那么如何算法化呢?当然是排序,然后遍历维护射击区间。1,排序,按照左端点。2,遍历气球数组,维护一个设计区间,初始化就是第一个气球的区间,同时贪心尽可能多的击穿更多气球,然后更新设计区间。3,直到没有新的气球可以被击穿,那么增加...
2019-05-18 22:00:04
191
转载 全面梳理:准确率,精确率,召回率,查准率,查全率,假阳性,真阳性,PRC,ROC,AUC,F1
二分类问题的结果有四种:逻辑在于,你的预测是positive-1和negative-0,true和false描述你本次预测的对错true positive-TP:预测为1,预测正确即实际1false positive-FP:预测为1,预测错误即实际0true negative-TN:预测为0,预测正确即实际0false negative-FN:预测为0,预测错误即实际...
2019-04-14 21:40:26
7481
原创 神经网路权重初始化方式
在开始训练网络之前,还需要初始化网络的参数。方式有: 错误:全零初始化。让我们从应该避免的错误开始。在训练完毕后,虽然不知道网络中每个权重的最终值应该是多少,但如果数据经过了恰当的归一化的话,就可以假设所有权重数值中大约一半为正数,一半为负数。这样,一个听起来蛮合理的想法就是把这些权重的初始值都设为0吧,因为在期望上来说0是最合理的猜测。这个做法错误的!因为如果网络中的每个神经元都...
2019-04-13 17:34:07
522
转载 RNN梯度爆炸原因和LSTM解决梯度消失解释
RNN梯度爆炸原因:经典的RNN结构如下图所示:假设我们的时间序列只有三段, 为给定值,神经元没有激活函数,则RNN最简单的前向传播过程如下:假设在t=3时刻,损失函数为 。则对于一次训练任务的损失函数为 ,即每一时刻损失值的累加。使用随机梯度下降法训练RNN其实就是对 、 、 以及 求偏导,并不断调整它们以使L尽可能达到最小的过...
2019-04-11 16:57:07
10928
2
转载 决策树CART算法讲解
ID3和C4.5在上一篇,点击转载:https://www.cnblogs.com/pinard/p/6053344.html
2019-04-09 14:41:33
1034
转载 决策树ID3和C4.5
决策树CART在下一篇:点击转载:https://www.cnblogs.com/pinard/p/6050306.html#!comments
2019-04-09 14:30:44
205
转载 word2vec简单通俗易懂
word2vec 是 Google 于 2013 年开源推出的一个用于获取 word vector 的工具包,它简单、高效,因此引起了很多人的关注。由于 word2vec 的作者 Tomas Mikolov 在两篇相关的论文 [3,4] 中并没有谈及太多算法细节,因而在一定程度上增加了这个工具包的神秘感。一些按捺不住的人于是选择了通过解剖源代码的方式来一窥究竟。 第一次接触 word2...
2019-04-05 15:17:53
516
原创 C++实现归并排序
#include<iostream>#include<vector>using namespace std;void merge(vector<int>&arr, int start, int mid, int end){ vector<int> tmp; int i = start; int j = mid+1;...
2019-04-04 20:41:33
2407
转载 通俗易懂的堆排序C++实现
堆排序 堆排序是利用堆这种数据结构而设计的一种排序算法,堆排序是一种选择排序,它的最坏,最好,平均时间复杂度均为O(nlogn),它也是不稳定排序。首先简单了解下堆结构。堆 堆是具有以下性质的完全二叉树:每个结点的值都大于或等于其左右孩子结点的值,称为大顶堆;或者每个结点的值都小于或等于其左右孩子结点的值,称为小顶堆。如下图:同时,我们对堆中的结点按层进行编号,将这种逻辑结...
2019-04-04 20:38:10
2343
4
原创 C++代码 快速排序总结
实现快速排序算法的关键在于先在数组中找到一个数(基数),接下来把数组分为两部分,把小于该数的数字移到数组的左边,把大于该数的数字移动数组的右边。等于该数的数字不动。先给一张通俗易懂的过程演示图讲解第一次排序3 4 1 7 6 2 0 基数:3第一步:首先找一个基数,以数组第一个数为基数,保存基数。定义两个指针start,e...
2019-03-29 18:07:37
234
原创 pickle.dump()把大量数据写入文件发生MemoryError解决方法
跑了12个小时的代码,最后因为pickle.dump()发生MemoryError错误,实在头疼。pickle.dump()有个bug就是不能存储大量数据,所以只能用别的方法,我用的是joblib读写方式,轻松搞定,Yes!from sklearn.externals import joblib#写的方式save_file = os.path.join(save_path, "detec...
2019-03-11 09:20:54
10016
8
原创 秒懂文件路径 / 和 ./ 和 ../ 和 ../../
/ 表示当前路径的根路径./ 表示当前路径../表示父级路径,当前路径所在的上一级路径。../../ 表示当前路径所在的上上级路径例子:用python读取D:/A/B/C/D/1.jpg文件。用os.getced()当前python所在的路径,比如:D:/A/B/C/D读取方法:1、从cv2.imread(1.jpg) 2、cv2....
2019-03-08 16:43:51
2565
转载 二叉树的深度优先遍历(DFS)与广度优先遍历(BFS)
二叉树的深度优先遍历(DFS)与广度优先遍历(BFS)深度优先遍历:从根节点出发,沿着左子树方向进行纵向遍历,直到找到叶子节点为止。然后回溯到前一个节点,进行右子树节点的遍历,直到遍历完所有可达节点为止。广度优先遍历:从根节点出发,在横向遍历二叉树层段节点的基础上纵向遍历二叉树的层次。DFS:ABDECFGBFS:ABCDEFGDFS实现:数据结构:栈父节点入栈,父节点出栈,先右...
2019-02-28 13:32:19
366
转载 从Word Embedding到Bert模型—自然语言处理中的预训练技术发展史
张俊林博士的解读, 知乎专栏:从Word Embedding到Bert模型—自然语言处理中的预训练技术发展史PPT链接:https://pan.baidu.com/s/1CR63tX64jIASQ0YgnUbh6ABert最近很火,应该是最近最火爆的AI进展,网上的评价很高,那么Bert值得这么高的评价吗?我个人判断是值得。那为什么会有这么高的评价呢?是因为它有重大的理论或者模型创新...
2019-02-21 17:16:36
519
原创 统计学习方法(—)——统计学习方法概念
1、统计学习方法概念 统计学习方法包括模型的假设空间、模型选择的准则以及模型学习的算法,称统计学习方法的三要素,简称为模型、策略和算法。 模型的假设空间:包含所有可能的条件概率分布或决策函数。例如,决策函数是输入变量的线性函数,那么模型的假设空间就是所有这些线性函数构成的函数集合,假设空间的模型一般有无穷多个。 模型选择的准则:一个评估方法从模型的假设空间中选择最优模型。...
2019-02-21 17:05:45
342
原创 c++中4个与类型转换相关的关键字总结
C++中,四个与类型转换相关的关键字:static_cast、const_cast、reinterpret_cast、dynamic_cast。1.static_cast------运算符完成相关类型之间的转换**特点:静态转换,在编译处理期间。使用场景:主要用于C++中内置的基本数据类型之间的转换,但是没有运行时类型的检测来保证转换的安全性。如在同一类层次结构中的一个指针类型到另一个...
2019-02-21 10:56:53
348
转载 极大似然估计
极大似然估计 以前多次接触过极大似然估计,但一直都不太明白到底什么原理,最近在看贝叶斯分类,对极大似然估计有了新的认识,总结如下:贝叶斯决策 首先来看贝叶斯分类,我们都知道经典的贝叶斯公式: 其中:p(w):为先验概率,表示每种类别分布的概率;:类条件概率,表示在某种类别前提下,某事发生的概率;而为后验概率,表示某事发生了,...
2019-02-21 10:43:36
145
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人