
算法
文章平均质量分 90
YShuaiLong
热爱生活,珍惜生命。
展开
-
Day3-中文分词技术(常用分词技术介绍)
1:分词技术 1.1:规则分词 基于规则的分词是一种机械分词的方法,主要是通过维护词典,在切分语句时,将语句的每个字符串与词表中的词进行逐一匹配,找到则切分,否则不切分。 1.1.1 正向最大匹配法 正向最大匹配法(Maximum Match Method,MM法)的基本思想:假定分词词典中的最长词有i个汉字字符,则用被处理文档的当前子串中的前i个字作为匹配字段,查找字典。如果字典中存在这样的一个i字词,则匹配成功,匹配字段被作为一个词切分出来。如果词典中找不到这样的一个i字词,则匹配失败,将匹配字原创 2021-04-09 10:48:49 · 1371 阅读 · 0 评论 -
LeetCode算法(1):从排序数组中删除重复项
示例1: 给定数组 nums = [1,1,2], 函数应该返回新的长度 2, 并且原数组 nums 的前两个元素被修改为 1, 2。 你不需要考虑数组中超出新长度后面的元素。 示例2: 给定 nums = [0,0,1,1,1,2,2,3,3,4], 函数应该返回新的长度 5, 并且原数组 nums 的前五个元素被修改为 0, 1, 2, 3, 4。 你不需要考虑数组中超出...原创 2019-01-07 11:04:36 · 213 阅读 · 0 评论