nlp
文章平均质量分 80
he_jin_jin
其实我还是不是太支持女生走计算机这条路,不过在硕士的期间还是要干好自己的事情。活在当下才能为今后的目标奠定好基础。
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
文本相似度十大方法简要说明
1、余弦相似性 余弦(余弦函数),三角函数的一种。在Rt△ABC(直角三角形)中,∠C=90°,角A的余弦是它的邻边比三角形的斜边,即cosA=b/c,也可写为cosA=AC/AB。余弦函数:f(x)=cosx(x∈R) 这是一个非常常见的算法,相信大家都应该学过余弦定理了,简单来说这个算法就是通过计算两个向量的夹角余弦值来评估他们的相似度。 假设向量a、b的坐标分别为(x1,y1)原创 2017-04-21 17:13:39 · 2052 阅读 · 1 评论 -
文本挖掘之特征选择(python实现)
机器学习算法的空间、时间复杂度依赖于输入数据的规模,维度规约(Dimensionality reduction)则是一种被用于降低输入数据维数的方法。维度规约可以分为两类: 特征选择(feature selection),从原始的d维空间中,选择为我们提供信息最多的k个维(这k个维属于原始空间的子集)特征提取(feature extraction),将原始的d维空间映射到k维空间中(新的k维转载 2017-06-03 15:16:14 · 6728 阅读 · 6 评论
分享