在学习CNN的过程中无意中在微博上翻到了大家很久都在传阅这个东西的相关资料,就想这到底是个什么样的东西能让这么多的大牛都去传阅?在好奇心驱使下就去翻了翻这方面的资料。
首先,将我看到资料的链接保存到这,以后还能在深入的看看:
http://blog.youkuaiyun.com/mytestmy/article/details/26969149 csdn上面比较整体的介绍了一下Word2vec。
http://www.52ml.net/14267.html 我爱机器学习网站上面的总结的些许资料,主要的paper和相关的源代码的链接,
Google的http://word2vec.googlecode.com/svn/trunk/ 及三篇著名的paper
有道几个人写的word2vec的解析文档 http://www.52ml.net/wp-content/uploads/2014/02/word2vec.pdf
具体的内容我就不说了,当然了凭借我菜鸟的水平在一天之内的功夫,也只能是盲人摸象。不多献丑了……
我要说的是一个菜鸟的启蒙路线:
看到一个新的东西,不能盲目的往上冲,首先,要弄清楚这是干什么的,是属于计算机门类里面的哪一个;接下来,就要看它的核心竞争是哪个模块,这样在看的过程中就有了重点,所有的算法都可以表达为一个函数*y=f(*x) ,当然了要知道函数的作用,输入,输出。在将这个函数定位到整个应用的具体位置上。
第一次看的过程中,我建议不要进入算法的内部去看它的实现细节,只需要知道函数的作用,输入,输出,整个浏览一遍,对整体有个清晰的认识之后才行。第一次阅读的目标就是,要有个整体的认识,核心是什么,要解决什么问题,以前还有什么样的解决方案,为什么要提出这个算法。
第二次看的过程中,在去掉它的外壳进入到内部去看它的细节,看到学习它要什么预备知识,总共分成几个模块,等等……
算了,还是不说自己的见解了,等到有时间详细的阅读了这方免得东西,在进行补充吧!