
工程算法
文章平均质量分 84
工程算法
文晓武
专注搜索推荐问答推荐工程领域,涉及到的技术有:Java、ElasticSearch、SpringBoot、SpringCloud、Dubbo、Linux、Docker、Sql、Kafka、RabbitMQ、RocketMQ、MyBatis、XXl-Job、Zookeeper、Nginx、Redis、Tomcat、Git、SVN、Maven、K8S等,每周不定期更新精华文章!
展开
-
基于词典的正向/逆向最大匹配算法
编程语言是人类与计算机之间交流的工具,而所谓的自然语言则是人类与人类之间交流的工具,那么计算机是如何理解人与人之间交流所使用的语句呢?今天讲一种常用的自然语言处理算法——双向最大匹配算法,这种算法虽然实现简单,但是依赖庞大的词库,词库相当的情况下,能取得不错的分词效果。双向最大匹配算法”中的“双向”就是正向和反向。所以先来说正向匹配法。正向匹配法就是按照正向阅读顺序,根据词库中的词对句子进行匹配,我们已“苏州中学生前来参观”这句话为例(词库中存在各种长度的词语,这里假设词库中最长的单词长度为5)正向匹配法丨转载 2022-06-21 14:10:08 · 968 阅读 · 0 评论 -
如何理解归一化(normalization)?
在机器学习领域中,不同评价指标(即特征向量中的不同特征就是所述的不同评价指标)往往具有不同的量纲和量纲单位,这样的情况会影响到数据分析的结果,为了消除指标之间的量纲影响,需要进行数据标准化处理,以解决数据指标之间的可比性。原始数据经过数据标准化处理后,各指标处于同一数量级,适合进行综合对比评价。其中,最典型的就是数据的归一化处理。简而言之,归一化的目的就是使得预处理的数据被限定在一定的范围内(比如[0,1]或者[-1,1]),从而消除奇异样本数据导致的不良影响。奇异样本数据是指相对于其他输入样本特别大或特别转载 2022-06-15 11:37:49 · 9820 阅读 · 1 评论 -
图论算法基础
经常有读者问我「图」这种数据结构,其实我在学习数据结构和算法的框架思维中说过,虽然图可以玩出更多的算法,解决更复杂的问题,但本质上图可以认为是多叉树的延伸。面试笔试很少出现图相关的问题,就算有,大多也是简单的遍历问题,基本上可以完全照搬多叉树的遍历。那么,本文依然秉持我们号的风格,只讲「图」最实用的,离我们最近的部分,让你心里对图有个直观的认识,文末我给出了其他经典图论算法,理解本文后应该都可以拿下的。图的逻辑结构和具体实现一幅图是由节点和边构成的,逻辑结构如下:什么叫「逻辑结构..转载 2022-04-25 07:54:45 · 298 阅读 · 0 评论 -
RSA 非对称加密算法详细介绍
背景RSA 算法大家肯定都听说过了,它是一种常见的非对称加密算法,常用来对一些在网络上传输的敏感信息进行加密。但具体流程不知道大家清楚不?本文将概述 RSA 算法的流程,并用一个简单示例进行阐述,最后讲解了一种意想不到的“旁门左道”的破解方式。RSA 算法流程具体算法流程如下: 找到互质的两个数,p和q, 计算N = p*q 确定一个数e, 使得e与(p-1)(q-1)互质, 此时公钥为(N, e), 告诉给对方 确定私钥d, 使得e*d-1...转载 2022-04-25 07:52:33 · 2306 阅读 · 0 评论 -
算法时间复杂度:O(logn)的底数是多少?
大家好,我是老三,最近裸辞了,在面试。前两天一个面试,只面了十分钟就结束了——事情是这样的:面试官:你能说说HashMap的数据结构吗?老三:数组+链表+红黑树,阿巴阿巴……面试官:那你说说红黑树的查找复杂度是多少?老三:O(logn)。面试官:那这个复杂度的底数是多少?老三:时间复杂度O(logn)有底数?面试官:没有吗?尬住……面试官:那你再说一下快速排序的时间复杂度?底数是多少?老三露出智(尴)慧(尬)的微笑……面试官:好了,我没什么要问的了,这转载 2022-02-24 13:58:46 · 3281 阅读 · 2 评论 -
基础概念 | 公约数、公倍数、互质数
1. 什么叫公约数?公约数,亦称“公因数”。它是几个整数同时均能整除的整数。如果一个整数同时是几个整数的约数,称这个整数为它们的“公约数”;公约数中最大的称为最大公约数。公约数与公倍数相反,就是既是A的约数同时也是B的约数的数,12和15的公约数有1,3,最大公约数就是3。再举个例子,30和40,它们的公约数有1,2,5,10,最大公约数是102. 什么叫公倍数?公倍数(common multiple)指在两个或两个以上的自然数中,如果它们有相同的倍数,这些倍数就是它们的公倍数。这些公倍数中转载 2022-02-24 10:49:47 · 5644 阅读 · 0 评论 -
聊聊一致性hash算法
这两天看到技术群里,有小伙伴在讨论一致性hash算法的问题,正愁没啥写的题目就来了,那就简单介绍下它的原理。下边我们以分布式缓存中经典场景举例,面试中也是经常提及的一些话题,看看什么是一致性hash算法以及它有那些过人之处。构建场景假如我们有三台缓存服务器编号node0、node1、node2,现在有3000万个key,希望可以将这些个key均匀的缓存到三台机器上,你会想到什么方案呢?我们可能首先想到的方案,是取模算法hash(key)% N,对key进行hash运算后取模,N是机器的数量。转载 2022-02-23 17:17:25 · 807 阅读 · 0 评论