
NLP
文章平均质量分 55
嘉木空青
工科硕士,从事信号处理,数据分析,人工智能算法研究。19年入职场,现从事机器学习工作。
展开
-
最大似然估计--最容易让人理解的解释
最大似然估计原创 2022-06-06 22:39:50 · 820 阅读 · 1 评论 -
TF-IDF算法
算法简介先简单解释一下,TF是词频(Term Frequency),IDF是逆文本频率指数(Inverse Document Frequency)。TF-IDF是一种统计方法,用以评估一字词对于一个文件集或一个语料库中的其中一份文件的重要程度。字词的重要性随着它在文件中出现的次数成正比增加,但同时会随着它在语料库中出现的频率成反比下降。TF-IDF加权的各种形式常被搜索引擎应用,作为文件与用户查询之间相关程度的度量或评级。某一特定文件内的高词语频率,以及该词语在整个文件集合中的低文件频率,可原创 2022-05-29 18:23:32 · 1010 阅读 · 0 评论 -
NLP学习笔记一(小白上手)
自然语言处理简介#研究人与计算机之间用自然语言进行有效通信的理论与方法。融语言学、计算机科学、数学等一体的科学。旨在从文本数据中提取信息,目的是让计算机理解或处理自然语言,以执行自动翻译、文本分类、情感分析等。入门基础#1)数学基础线性代数、概率论、统计学;2)语言学基础:语音、词汇、语法3)Python基础4)机器学习基础:统计学习方法、机器学习周志华5)深度学习基础:CNN、RNN、LSTM6)自然语言处理理论基础:统计自然语言处理、Python自然语言处理、数学之美原创 2022-03-06 00:25:28 · 467 阅读 · 0 评论