自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

weixin_38659482的博客

业精于勤而荒于嬉,行成于思而毁于随

  • 博客(15)
  • 收藏
  • 关注

原创 常见激活函数总结(持续更新)

激活函数((Activation functions)就是人工神经网络中的非线性函数,目的是为了给神经网络引入非线性层。

2022-11-22 23:09:02 511

原创 02、PMI点互信息 & PPMI(Positive PMI)

在词的向量化表示中,简单的One-Hot会遇到数据稀疏和无法计算词之间距离的问题;分布式频次表示会遇到高频词误导计算结果的问题。基于点互信息的词向量表示方式恰好可以解决上述问题。PMI点互信息1. 概念和公式点互信息(Pointwise Mutual Information,PMI)是信息轮中用来衡量两个事物之间的相关性的一个指标。例如对于词A和词B的点互信息为:其中,表示词A和词B共同出现的频率,表示词A出现的频率,表示词B出现的频率。2. 示例上下文我 喜欢 游泳。

2022-03-06 22:00:22 2062 2

原创 01、词的独热(one-hot)表示

想要利用计算机对自然语言进行处理,需要解决的第一件事便是自然语言的存储和计算问题。最自然和直观的方式便是采用String类型。在String类型的表示下,自然语言的处理往往是基于规则的方式——例如文本情感分类中,可以将“喜欢”、“优秀”等设置为褒义,“厌恶”、“蛮横”设置为贬义词,最简单的分类规则可以采用文本中褒义贬义词的个数...

2022-03-06 20:49:01 1908

转载 常见的距离计算公式—— 切比雪夫距离 ( Chebyshev Distance )

国际象棋玩过么?国王走一步能够移动到相邻的8个方格中的任意一个。那么国王从格子(x1,y1)走到格子(x2,y2)最少需要多少步?自己走走试试。你会发现最少步数总是max(| x2-x1 | , | y2-y1 | ) 步。有一种类似的一种距离度量方法叫切比雪夫距离。(1)二维平面两点a(x1,y1)与b(x2,y2)间的切比雪夫距离 (2)两个n维向量a(x11,x1...

2018-12-17 11:25:39 21182 2

原创 常见的距离计算公式——欧式距离(Euclidean Distance)

计算公式二维空间的公式其中,为点与点之间的欧氏距离;为点到原点的欧氏距离。三维空间的公式n维空间的公式

2018-12-17 10:31:49 173979

原创 ubuntu16.04中指定R语言安装,并连接到notebook和spark

1.R语言安装指定版本在/etc/apt/source.list文件中添加源deb http://cran.stat.ucla.edu/bin/linux/ubuntu/ xenial/更新sudo apt-get update查看指定版本并安装lxx@lxx:~$ sudo apt-cache showpkg r-base | grep 3.3.13.3.3-...

2018-11-22 15:34:42 914

原创 扩展notebook功能——可以提交到yarn上运行

此次配置分步进行,便于问题的一步步解决:集群上spark-submit,local模式和yarn模式运行成功 非集群spark-submit,local模式和yarn模式运行成功 集群python命令行交互模式,local模式,yarn模式运行成功 非集群python命令行交互模式,local模式,yarn模式运行成功 notebook中local模式运行成功 notebook中ya...

2018-11-16 16:47:46 506

转载 在scala中:: , +:, :+, :::, +++的区别总结

初学scala的人都会被Seq的各种操作符所confuse。下面简单列举一下各个Seq操作符的区别。4种操作符的区别和联系 :: 该方法被称为cons,意为构造,向队列的头部追加数据,创造新的列表。用法为 x::list,其中x为加入到头部的元素,无论x是列表与否,它都只将成为新生成列表的第一个元素,也就是说新生成的列表长度为list的长度+1(btw,x::list等价于list.::...

2018-09-04 20:52:57 170

转载 常见的java Exception类型

一般面试中java Exception(runtimeException )是必会被问到的问题常见的异常列出四五种,是基本要求。更多的。。。。需要注意积累了 常见的几种如下: NullPointerException - 空指针引用异常ClassCastException - 类型强制转换异常。IllegalArgumentException - 传递非法参数异常。Ari...

2018-08-08 14:14:00 1079

转载 概率分布之二项分布与多项分布

https://blog.youkuaiyun.com/jteng/article/details/546323111. 伯努利分布(Bernoulli distribution)  伯努利分布又称二点分布或0-1分布,即一次试验只有正例和反例两种可能,以随机变量表示就是X只能取0或1,伯努利试验是只有两种可能结果的单次随机试验,假设一次试验出现正例的概率为p(0<p<1),那么P(X=1...

2018-07-23 11:57:40 8739

转载 P问题、NP问题、NPC问题(NP完全问题)、NPH问题和多项式时间复杂度

https://blog.youkuaiyun.com/K346K346/article/details/510260061.多项式时间复杂度定义: 解决问题需要的时间与问题的规模之间是多项式关系。多项式关系形如O(n^k)O(n^k),k为某个常数,n是问题的输入规模。例如,时间复杂度为O(nlog(n))、O(n^3)都是多项式时间复杂度。时间复杂度为O(n^log(n))、O(2^n)是...

2018-07-23 11:32:24 5612

转载 贝叶斯公式的直观理解(先验概率/后验概率)

前言  以前在许学习贝叶斯方法的时候一直不得要领,什么先验概率,什么后验概率,完全是跟想象脱节的东西,今天在听喜马拉雅的音频的时候突然领悟到,贝叶斯老人家当时想到这么一种理论前提可能也是基于一种人的直觉.先验概率:是指根据以往经验和分析得到的概率.[1]  意思是说我们人有一个常识,比如骰子,我们都知道概率是1/6,而且无数次重复实验也表明是这个数,这是一种我们人的常识,也是我们在...

2018-07-20 20:14:06 557

转载 htop 简介——新

htop 简介 htop类似于 top 命令,但可以让你在垂直和水平方向上滚动,所以你可以看到系统上运行的所有进程,以及他们完整的命令行。可以不用输入进程的 PID 就可以对此进程进行相关的操作 (killing, renicing)。htop 是Linux系统中的一个互动的进程查看器,一个文本模式的应用程序(在控制台或者X终端中),需要ncurses。与Linux传统的top相比,hto...

2018-07-20 17:24:36 3063

转载 Linux htop工具使用详解

一.Htop的使用简介大家可能对top监控软件比较熟悉,今天我为大家介绍另外一个监控软件Htop,姑且称之为top的增强版,相比top其有着很多自身的优势。如下: 两者相比起来,top比较繁琐 默认支持图形界面的鼠标操作 可以横向或纵向滚动浏览进程列表,以便看到所有的进程和完整的命令行 杀进程时不需要输入进程号等 二.软件的获取与安装Htop的安装,...

2018-07-20 16:43:40 304

转载 各种范数的解释

原文:https://blog.youkuaiyun.com/u011484045/article/details/44671827范数范数包括向量范数和矩阵范数: 向量范数的定义(摘录自百度文库): 常用的向量范数有: 0范数(L0范数)-向量中非0元素的个数。 1范数(L1范数)-向量中各个元素绝对值之和。 2范数(L2范数)-向量的模长。 无穷...

2018-07-18 16:35:35 1772

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除