- 博客(361)
- 收藏
- 关注
原创 华为机试准备-输入输出数组和变量
ACM模式要比力扣题目多写不少代码,相对来说ACM模式更锻炼代码能力,而力扣题目是把侧重点完全放在算法逻辑上。输入输出是acm模式的常规手法,熟练常用输入输出可节省时间。
2023-01-30 20:21:01
559
原创 从快速排序的递归方式和非递归方式来看函数调用帧栈
#include<iostream>#include<vector>#include<stack>#include<cstdlib>#include<algorithm>using namespace std;//根据轴分开两边template <typename Data>int partit...
2019-05-19 11:19:01
566
原创 KMP匹配算法
举例来说,有一个字符串"BBCABCDABABCDABCDABDE",我想知道,里面是否包含另一个字符串"ABCDABD"?KMP匹配算法代码实现:#include <string>#include <vector>#include <queue>#include <iostream>#include <stdio.h&...
2019-05-15 00:15:49
578
原创 leetcode算法总结
leetcode总结:leetcode的资料在网上已较多,这里对各个算法进行归纳总结和简单分析。电子书形式方便查询。持续更新。由于csdn对长文件的排版较难编写和查看,于是放到github上https://github.com/doerjiayi/algorithm...
2019-04-28 01:14:44
3904
原创 解码websocket (c++)
websocket 是web常用的协议,可用来支持自定义协议。以下是用c++根据websocket握手协议websocket协议格式来处理websocket 协议解码(1)第一步,websocket升级协议判断是否是http协议,并且是websocket的升级握手协议E_CODEC_STATUS CodecWebSocketJson::Decode(tagConnectionAt...
2017-07-23 03:01:42
5629
原创 Levenshtein编辑距离
编辑距离概念描述:编辑距离,又称Levenshtein距离,是指两个字串之间,由一个转成另一个所需的最少编辑操作次数。许可的编辑操作包括将一个字符替换成另一个字符,插入一个字符,删除一个字符。例如将kitten一字转成sitting:sitten (k→s)sittin (e→i)sitting (→g)俄罗斯科学家Vladimir Levenshtein在1965年提出这
2017-07-11 00:27:46
876
原创 Sphinx之匹配方式
Sphinx添加了相当多的匹配和rank模式,并且将添加更多。一些不同的问题经常被提出,从“我怎样让指定的文档排在第一位”到 “我怎么根据匹配度来评定星级”,实际处理要归结于内在的匹配和排序。匹配方式匹配方式有基础匹配模式和拓展的匹配模式。匹配本质Sphinx 1.10版本中使用的两个最重要的权重因子是:1)经典统计学BM25因子,从80年代开始被大部分的搜索引擎使用,2)
2016-12-14 00:37:14
9019
原创 coreseek之mmseg分词和词库拓展
mmseg分词mmseg分词算法是基于统计模型的,所以算法的规则也是来自对语料库的分析和数学归纳,因为中文字符没有明确的分界,会导致大量的字符分界歧义,而且,中文里面,词和短语也很难界定,因此,算法除了要做统计和数学归纳之外,还要做歧义的解决。在mmseg分词中,有一个叫chunk的概念:chunk,是一句话的分词方式。包括一个词条数组和四个规则。如:研究生命,有“研究/生命”和“
2016-12-14 00:32:39
2831
1
原创 DFA确定性有限状态机过滤敏感词
通常把确定的有穷状态自动机(有穷状态自动机也就是本文讨论的这种状态机)称为DFA,把非确定的有穷状态自动机称为NFA。
2016-06-17 15:50:32
3484
原创 互联网后台服务器流水日志系统设计
在互联网后台服务器中常需要记录互联网软件的流水日志,日志服务器和入库工具则是处理此类功能。日志服务器会接受逻辑服务器发送的日志消息,将其写入本地日志文件。每隔一段时间,再由日志入库服务器将日志文件导入数据库。1. 日志服务器日志服务器接收其他服务器服务器发送的json格式日志消息,并写入到日志文件。日志服务器不需要解析消息内容,定时批量写入日志文件。日志文件包含日志描述文件和日
2016-03-14 15:06:47
6983
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人