
机器学习
文章平均质量分 63
cuoguo_xin
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
卷积相乘和矩阵相乘不一样的地方?
卷积的乘法和矩阵的乘法不一样,卷积的求和相当于加权求和,也可以称为加权叠加,矩阵相乘是将一个m×n的矩阵就是m×n个数排成m行n列的一个数阵。卷积乘法示例: 3 * 3 的像素区域R与卷积核G的卷积运算: R5(中心像素)=R1G1 +R2G2 + R3G3 + R4G4 + R5G5 + R6G6 + R7G7 + R8G8 + R9G9 ...原创 2018-05-25 16:25:02 · 15909 阅读 · 1 评论 -
CNN中权值共享
简单来说就是用一个卷积核来和一个图像来进行卷积,记住是同一个卷积核,不改变卷积核的值。这样可以减少权值参数。共享就是一个图片对卷积核是共同享有的。对于一个100*100像素的图像,如果我们用一个神经元来对图像进行操作,这个神经元大小就是100*100=10000,单如果我们使用10*10的卷积核,我们虽然需要计算多次,但我们需要的参数只有10*10=100个,加上一个偏向b,一共只需要101个参数...原创 2018-05-25 17:10:42 · 1925 阅读 · 0 评论 -
用谷歌的GPU跑你的代码----Colaboratory使用记录
Google不愧为大佬,给我们这些小(穷)白(鬼)开放了一个Gpu的端口,让我们的体会了一下GPU的速度。本人亲测,我的代码在我的笔记本上跑了20分钟,但上传到Colaboratory上只需要3分钟就可以给我答案。但Colaboratory并不是那么简单,我研究了一天,终于找到了一些技巧,特意记录下来。 Colaboratory是谷歌云盘的一个工具,谷歌官方给出的解释是“Colabora...原创 2018-05-21 22:20:37 · 19661 阅读 · 4 评论 -
CNN原理
一、卷积对图像(不同的数据窗口数据)和滤波矩阵(一组固定的权重:因为每个神经元的多个权重固定,所以又可以看做一个恒定的滤波器filter)做内积(逐个元素相乘再求和)的操作就是所谓的『卷积』操作,也是卷积神经网络的名字来源。如图所示,1*1+1*0+1*1+0*0+1*1+1*0+0*1+0*0+1*1=4,所以对原图片进行卷积后的第一个值为4,后面也一样。那个乘以原图片的矩阵叫做卷积核,具体用来...原创 2018-05-23 17:37:39 · 884 阅读 · 0 评论 -
爬取链家网站的北京租房信息
本来准备这个暑假好好复习,但学校安排暑期实践,既然学校安排这个,而且我自己也觉得需要提高一下自己的能力,所以静下心来做点事吧。我们要做到项目是分析北京地区的租房的信息分析。我们需要做的是爬取链家网站上北京地区的租房信息。链家作为国内比较出名的房地产中介公司,发布的房地产租房信息还是不叫权威的。我们需要做的分为两步:找到各个租房页面的链接,爬取每个租房页面的数据。第一步找到每个租房页面的链接,北京地...原创 2018-07-03 20:07:23 · 1639 阅读 · 0 评论 -
MaxentClassifier.train()遇到错误AttributeError: 'list' object has no attribute 'items'
我在训练最大熵模型时,遇到错误x["index"] = range(len(x))xdic = x.set_index("index").T.to_dict("list")train = []for i in range(len(xdic)): train.append((xdic[i], y[i]))classifier = MaxentClassifier.train(tr...原创 2018-07-21 22:43:35 · 26262 阅读 · 0 评论 -
利用Word2vec将旅游评论数据转化为词向量
实训结束有段时间啦,我准备吧实训的所有的东西整理整理,然后安心复习考研。前面我将所有的评论把各个网站的旅游数据给扒了下来,文章链接:百度旅游、大众点评、驴妈妈、猫途鹰、携程关于评论的爬虫总结(附源码)。我们将所有扒了下来之后数据整理之后的数据截图如下:我们训练好的模型截图为(因为训练好的模型大概有500MB,无法用记事本打开,所以只能用python读取之后截图) ...原创 2018-08-07 19:59:04 · 4737 阅读 · 7 评论 -
利用最大熵模型来训练词向量
前面我们已经训练好词向量了,利用Word2vec将旅游评论数据转化为词向量,这篇文章主要介绍用最大熵模型训练我们上文得到的词向量。最终代码已上传到github上,传送门一、读取数据读取上一级的得到的词向量,并划分测试集合训练集,具体代码如下:print ("读取数据")df = pd.read_csv(r"E:\shixun\vvvv.csv")df.filln...原创 2018-08-07 20:27:25 · 631 阅读 · 0 评论 -
KNN、贝叶斯来训练词向量
前面我们已经训练好词向量了,利用Word2vec将旅游评论数据转化为词向量,也有用最大熵模型来训练模型,利用最大熵模型来训练词向量,这次我们试着用KNN和贝叶斯来做。其实也就是调模型,也没有技术含量,所以直接上代码吧,不解释。print("knn")neigh = KNeighborsClassifier(n_neighbors=3)neigh.fit(x_train, y_train)...原创 2018-08-07 20:55:23 · 857 阅读 · 1 评论