
NLP算法
文章平均质量分 94
故事挺秃然
攻城狮的故事挺秃然!!!
展开
-
NLP--词频统计和TF-IDF总结【实践】
词频统计以及TF-IDF原理以及代码实现,在TF-IDF中常被问的问题:为什么TF要进行标准化操作?为什么要取对数?为什么IDF分母中要进行+1(IDF如何进行平滑处理的)?为什么要词频 * 逆文档频率(TF-IDF要用乘法)?原创 2023-05-05 16:45:55 · 2045 阅读 · 1 评论 -
NLP--BPE、WordPiece、ULM、SentencePiece子词分词器总结【原理】
子词解决了词汇量问题,并在很大程度上有助于减少模型参数的数量,子词有助于保持词汇更加平衡。原创 2023-04-14 19:16:42 · 1867 阅读 · 0 评论 -
NLP--社区检测算法(Community Detection)总结【原理】
社区检测(Community Detection)又被称为是社区发现,用于评估节点组如何聚类或分区,以及它们增强或分离的趋势。重点对图算法中的社区检测进行了整理总结。原创 2022-08-30 18:04:56 · 21532 阅读 · 0 评论 -
NLP--中心性算法(Centrality Algorithms)总结【原理】
中心性算法(Centrality Algorithms):度中心性(Degree centrality)、接近中心性(Closeness centrality)、中介中心性(Betweenness centrality)、特征向量中心性(Eigenvector centrality)等原创 2022-08-29 18:57:52 · 8626 阅读 · 2 评论