
人工智能
文章平均质量分 82
渣渣睿全栈之路
多数人眼里不怎么精致的皮囊及不怎么有趣的灵魂。
展开
-
[书蕴笔记-2]使用word2vec模型迭代获取标签
使用word2vec模型迭代获取标签前言整体索引在此 :书蕴——基于书评的人工智能推荐系统之前把书评预处理并将每本书训练出了word2vec模型,本篇博客针对如何提取书籍的标签具体展开描述。这几天一直都没怎么学习,真的怠惰了。 大概是失恋后的正常反应吧。 虽然对不起她。 嘛。以上请自行忽略。思路索引篇也提到了,主要是通过word2vec模型,找出前a的高频词放入n原创 2018-02-02 19:40:36 · 1336 阅读 · 2 评论 -
书蕴——基于书评的人工智能推荐系统
书蕴——基于书评的智能推荐系统前言计算机设计大赛在即,和冬瑜、承意组队参加人工智能组,报的题目的:书蕴——基于书评的智能书籍推荐系统。 主体上是去做一个web系统,系统的核心功能是书籍收藏与书籍推荐。根据用户收藏书籍的书评(划重点了),来为用户推荐书籍创新点基于书籍标签协同过滤算法基于word2vec方法的自然语言处理标签抽取(这个名词还没想好)思路原创 2018-01-28 10:19:54 · 1618 阅读 · 1 评论 -
[书蕴笔记-1]word2vec模型训练
word2vec模型训练前言整体索引在此 书蕴——基于书评的人工智能推荐系统上次把文本进行了预处理,主要是使用正则去除标签以及对文本去除停用词以及结巴分词。 后续还会加入tf-idf来动态选取停用词。word2vec模型训练word2vec简介关于word2vec到底是什么,推荐一个链接:DL4J,有对理解帮助很大的图文 虽然链接里的word2vec是j原创 2018-01-29 11:09:49 · 1572 阅读 · 0 评论 -
[书蕴笔记-0]文本预处理
文本预处理前言整体索引在此 书蕴——基于书评的人工智能推荐系统思路因为数据是爬虫爬下来的,具体内容被写入到了excel表里,所以文本预处理分为2块。一个是从excel中获取数据,然后去掉文本中所有的html标签,最后整理成txt文档中一行一条评论的形式。另一个是对文本去停用词、分词,处理成一个词一个空格的形式,便于word2vec训练模型。代码与解释pre原创 2018-01-28 10:46:34 · 519 阅读 · 0 评论 -
[书蕴笔记-3]使用中文维基百科语料库的word2vec模型计算书籍距离
使用中文维基百科语料库的word2vec模型计算书籍距离前言瞎吹水晚上胃疼的难受,也不知道为什么,疼到炸裂……(大概是某个人的锅?应该是吃杂了==) 在床上折腾了会儿才好。日常吹水结束最后补充一句…… 失恋后的过渡期要结束了,我要迎来自己的大学巅峰。以为我能昨天晚上写完博客的,结果啥都没写==那就多说两句: 有些小智障……真的要抓紧时间学习了阿。 然原创 2018-02-03 17:32:15 · 4540 阅读 · 2 评论