
自然语言处理
文章平均质量分 96
裁风系铃,此时念想。
前路珍重,一念一响。
QomolangmaH
2023年度博客之星Top22
人工智能领域赛道Top2
大三赛道Top2
码龄2-3年赛道Top3
优快云校园主理人
展开
-
【自然语言处理】统计中文分词技术(一):1、分词与频度统计
本质上是字符串匹配的方法,将一串文本中的文字片段和已有的词典进行匹配,如果匹配到,则此文字片段就作为一个分词结果。利用词典匹配和统计模型的方法,结合了基于词典的规则和基于统计的概率模型,以提高分词准确性和效率。1.基于词典的词汇切分方法(又称机械词汇切分)1)正向最大匹配法(从左到右的方向);2)逆向最大匹配法(从右到左的方向);3)最小切分(每一句中切出的词数最小)4.词典与统计相结合的词汇切分方法。利用前趋字串和后继字串在。2.基于统计的词汇切分方法。3.基于理解的词汇切分方法。原创 2024-03-24 20:00:00 · 2794 阅读 · 1 评论 -
【自然语言处理】NLP入门(九):1、正则表达式与Python中的实现(9):自动机:⾮确定有限⾃动机与正则表达式
本文介绍了自动机理论,简介有限自动机(Finite Automata, FA)、下推自动机(Push-down Automata, PDA)、线性有界自动机(Linear Bounded Automata, LBA)、图灵机(Turing Machine, TM);重点介绍⾮确定有限⾃动机与正则表达式的对应关系。原创 2024-03-21 23:45:00 · 1629 阅读 · 5 评论 -
【自然语言处理】NLP入门(八):1、正则表达式与Python中的实现(8):正则表达式元字符:.、[]、^、$、*、+、?、{m,n}
本文介绍了正则表达式中常见的`.`、`[]`、`^`、`$`、`*`、`+`、`?`、`{m,n}`等元字符。原创 2024-03-20 23:45:00 · 2521 阅读 · 0 评论 -
【自然语言处理】NLP入门(七):1、正则表达式与Python中的实现(7):常用正则表达式、re模块:findall、match、search、split、sub、compile
本文将介绍常用正则表达式、re模块常用方法,包括findall、match、search、split、sub、compile等原创 2024-03-19 23:45:00 · 1530 阅读 · 0 评论 -
【自然语言处理】NLP入门(六):1、正则表达式与Python中的实现(6):字符串常用方法:find()、rfind()、index()、rindex()、count()、replace()
本文将介绍字符串常用方法,包括:find()、rfind()、index()、rindex()、count()、replace()等原创 2024-03-18 23:45:00 · 1138 阅读 · 0 评论 -
【自然语言处理】NLP入门(五):1、正则表达式与Python中的实现(5):字符串常用方法:对齐方式、大小写转换详解
本文介绍了字符串常用方法,包括:center()、ljust()、rjust();lower()、upper();capitalize()、title()、swapcase()等原创 2024-03-07 23:45:00 · 1502 阅读 · 0 评论 -
【自然语言处理】NLP入门(四):1、正则表达式与Python中的实现(4):字符串常用函数
本文介绍了字符串常用函数,包括:len();max() 和 min();ord()和chr();bin()、oct()、hex()等。原创 2024-03-05 23:30:00 · 1314 阅读 · 0 评论 -
【自然语言处理】NLP入门(三):1、正则表达式与Python中的实现(3):字符转义符及进制转换
转义字符在处理输入输出、正则表达式、字符串拼接等场景下经常被用到,本文将介绍python中的字符转义符。原创 2024-03-03 23:45:00 · 1402 阅读 · 1 评论 -
【自然语言处理】NLP入门(二):1、正则表达式与Python中的实现(2):字符串格式化输出(%、format()、f-string)
自然语言处理涉及字符串构造、截取与格式化输出等基础操作,本文将介绍使用%、format()、f-string方法格式化字符串。原创 2024-03-02 23:45:00 · 1907 阅读 · 0 评论 -
【自然语言处理】NLP入门(一):1、正则表达式与Python中的实现(1):字符串构造、字符串截取
自然语言处理涉及字符串构造、截取与格式化输出等基础操作,本文介绍了使用引号构造字符串、字符串索引、切片操作等。原创 2024-03-01 23:45:00 · 1589 阅读 · 3 评论