
NLP
小孟Tec
为什么我的眼里常含泪水?
因为我对这土地爱得深沉……
展开
-
正则表达式 - (?!), (?:), (?=)
文章目录引例正则表达式 - (?!), (?:), (?=)Reference引例用规则做信息抽取时,想匹配某些动词,但是该动词可能时名词的前缀。如:发动 是 发动机 的前缀对于句子: 奥迪汽车Q7的发动机型号是xxx,该句中 包含名词 发动机 但是不包含动词 发动,用正则的方式为:re.findall("发动(?!机)", sentence)正则表达式 - (?!), (?????, (?=)(?:pattern)非获取匹配,匹配pattern但不获取匹配结果,不进行存储供以后使用。原创 2020-07-09 00:48:19 · 850 阅读 · 0 评论 -
NLTK学习笔记2 --- 统计语言建模
2.1 理解单词频率词的搭配可以被定义为倾向于并存的两个或多个标识符的集合。例如: the United States, the United Kingdom, Union of Soviet Socialist Republics 等。 持续更新......原创 2018-09-08 21:57:33 · 152 阅读 · 0 评论 -
NLTK学习笔记 -- 字符串操作
字符串操作切分将文本(段落)切分成语句text = " Welcome readers. I hope you find it interesting. Please do reply. "print(nltk.tokenize.sent_tokenize(text))[' Welcome readers.', 'I hope you find it interesting.'...原创 2018-09-07 16:46:28 · 3188 阅读 · 1 评论 -
统计语言模型 -- Statistical Language Model
高阶语言模型: 假定文本中的每个词Wi和前面N-1个词有关,而与更前面的词无关,这样当前词Wi的概率只取决于前面N-1个词P(Wi-n+1,Wi-n+2,…,Wi-1),因此 P(Wi | W1,W2,…,Wi-1) = P(Wi | Wi-n+1,Wi-n+2,…,Wi-1)这种假设被称为N-1阶马儿可夫假设,对应的语言模型成为N元模型...原创 2018-12-25 21:57:20 · 430 阅读 · 0 评论 -
DeepNLP的表示学习·词嵌入来龙去脉·深度学习(Deep Learning)·自然语言处理(NLP)·表示(Representation)
DeepNLP的表示学习 --词嵌入来龙去脉 以及 深度学习(Deep Learning)·自然语言处理(NLP)·表示(Representation)Indexing:〇、序一、DeepNLP的核心关键:语言表示(Representation)二、NLP词的表示方法类型1、词的独热表示one-hot representation2、词...转载 2019-04-14 22:45:49 · 517 阅读 · 0 评论