
机器学习
文章平均质量分 78
Pushkin.
life feeds on negative entropy
展开
-
Python ML实战-工业蒸汽量预测02-数据探索
赛题数据探索,变量分析:单变量分析;多变量分析相关性分析,异常值监测,变量分布分析原创 2022-08-31 06:30:00 · 629 阅读 · 5 评论 -
【机器学习】卡方检验
卡方检验是一种确定两个分类变量之间是否存在显着相关性的统计方法。 这两个变量应该来自相同的人口,他们应该是类似 - 是/否,男/女,红/绿等。例如,我们可以建立一个观察人们的冰淇淋购买模式的数据集,并尝试将一个人的性别与他们喜欢的冰淇淋的味道相关联。 如果发现相关性,我们可以通过了解访问的人的性别的数量来计划适当的味道库存。python版:sklearn 测试如下(检验......原创 2018-07-24 10:17:23 · 5717 阅读 · 1 评论 -
【NLP】一文了解词性标注CRF模型
NLP 自然语言之一文了解词性标注CRF模型原创 2022-08-27 16:35:40 · 1499 阅读 · 18 评论 -
Python ML实战-工业蒸汽量预测01-赛题理解
python机器学习实战阿里云天池大赛 工业蒸汽量预测原创 2022-08-27 16:15:08 · 1103 阅读 · 4 评论 -
【Mock】Neo4j知识图谱数据集Mock、问答训练数据集mock
【数据mock】Neo4j知识图谱数据集Mock、问答训练数据集mock原创 2022-08-14 14:14:30 · 1798 阅读 · 48 评论 -
【百战机器学习】- 数学基础
机器学习数学基础深度学习数学基础机器学习面经原创 2022-08-10 07:30:20 · 264 阅读 · 3 评论 -
【NLP】特征工程_word2Vec_01_基础
word2vec是一种文本特征工程基本挖掘方法,相关模型值得学习借鉴。词向量模型word2vec,顾名思义可以将 自然语言词文本(语料) 量化为数学所使用的向量,故其常作为文本相关模型(如文本相似性;NLP…)研究的基本工作。场景: 谷歌2013提出word2vec是目前最常用的词嵌入模型之一,word2vec实际是一种浅层的神经网络模型,常见的有两种网络结构,CBOW和Skip-gram模......原创 2019-01-24 18:15:47 · 866 阅读 · 0 评论 -
【NLP】特征工程_word2Vec_02_实践_文本向量化
word2vec目前可以应用很多方面,如文本分类,文本聚类,相似度计算,推荐,NLP相关应用等等。那么今天就先玩下其文本向量化功能python版已实现word2vec的库有: gensim数据集要训练词向量就必须要有大量的语料库中文语料如下:腾讯AI Lab2018年分享的开源800万中文词的NLP数据集文章https://mp.weixin.qq.com/s?__biz=Mz..................原创 2019-01-24 19:26:14 · 1910 阅读 · 2 评论