
机器学习
Haven.Liu
龙七
展开
-
GitHub:机器学习汇总
一、刘建平博客机器学习配套GitHub代码博客:http://cnblogs.com/pinardGitHub:https://github.com/ljpzzz/machinelearning原创 2020-02-09 16:24:33 · 548 阅读 · 0 评论 -
数据集:谭松波--酒店评论语料、人脸68位关键点、WIDE Face数据集
一、谭松波--酒店评论语料链接:https://pan.baidu.com/s/1oObY4A_Ovo1CY00UrgbBKg提取码:kth7二、300WLP人脸识别-关键点定位-68位关键点定位数据集链接:https://pan.baidu.com/s/1qzS4MRChcvxVdg_NUFLKHA提取码:1lo6三、人脸识别-WIDE Face数据集链接:h...原创 2020-02-08 21:23:25 · 4351 阅读 · 8 评论 -
GitHub:NLP学习
一、fighting41love/funNLPNLP民工的乐园: 几乎最全的中文NLP资源库词库 工具包 学习资料https://github.com/fighting41love/funNLP二、nlpinaction/learning-nlp自然语言处理算法与实战本书主要是面向初学者,介绍了一些基础的入门知识和概念,同时提供一些偏向于实战的代码供给读者练习,这里...原创 2020-02-01 23:13:04 · 816 阅读 · 0 评论 -
文本分类机器学习算法摘记
一、 KMeans的优劣优点: 1.是解决聚类问题的一种经典算法,简单、快速 2.对处理大数据集,该算法保持可伸缩性和高效率 3.当结果簇是密集的,它的效果较好缺点 1.必须事先给出k(要生成的簇的数目),而且对初值敏感,对于不同的初始值,可能会导致不同结果。 2.对躁声和孤立点数据敏感二、召回率召回率是指检索出的 相关文档数 和 文档...原创 2019-12-26 17:44:47 · 396 阅读 · 0 评论 -
机器学习竞赛汇总
一、竞赛|数据竞赛Top解决方案开源整理https://mp.weixin.qq.com/s/_4QG0dWhh784lF0n1wymcw二、复盘所有NLP比赛的TOP方案https://github.com/zhpmatrix/nlp-competitions-list-review三、CDCS 中国数据竞赛优胜解集锦https://github.com/geek...原创 2019-12-05 15:21:53 · 1646 阅读 · 1 评论 -
机器学习:学术论文的来源
1.GitHub上开源代码标注引用的论文;NeuRec/evaluation/Evaluate.pyhttps://github.com/wubinzzu/NeuRec/blob/948aa1131b0f3dfd99b4d0d0d9ed919726877510/evaluation/Evaluate.py【在百度中搜索论文,可以在“百度学术”中搜索到该论文】...原创 2019-09-19 09:54:55 · 619 阅读 · 0 评论 -
PCA 学习笔记
1. 算法的时间复杂度跟维数成指数级增加2. 数据降维好处: 1.使数据集更容易使用; 2.降低算法的计算开销; 3.去除噪声; 4.减轻过拟合; 5.易于获取有价值的信息.3.操作方法: (1)特征选择:从原始特征中挑选最具代表性的一些特征。 特征子集选择体系结构,分为四部分: 子集评估度量、 ...原创 2018-08-05 16:59:21 · 1100 阅读 · 0 评论 -
机器学习 | 英文单词拾记
一、【专业术语缩写】1. ALS (Alternating Least Squares)协同算法:交替最小二乘法2. LDA两种缩写:【Latent Dirichlet allocation】 主题模型【Linear Discriminate Analysis】 线性判别分析单词注解: latent /ˈleɪtnt/adj. 潜在的;潜伏的;隐藏的...原创 2019-10-11 18:13:39 · 390 阅读 · 0 评论 -
模型评估指标
1.回归评估指标RMSE、MAE、MSE、决策系数;2.分类评估指标精准率、召回率、准确率、F值、PRC3.聚类评估指标兰德指数、互信息、轮廓系数原创 2019-10-11 18:22:34 · 315 阅读 · 0 评论