
machine learning
文章平均质量分 58
Jinlong_Xu
talk is cheap, show me code!
展开
-
python seaborn画图
python seaborn画图在做分析时候,有时需要画几个图看看数据分布情况,但总记不住python的绘图函数。今天有空顺便整理下python的seaborn绘图函数库。 Seaborn其实是在matplotlib的基础上进行了更高级的API封装,从而使得作图更加容易,在大多数情况下使用seaborn就能做出很具有吸引力的图,而使用matplotlib能制作具有更多特色的图。应该把Seaborn...转载 2018-03-31 15:39:09 · 4115 阅读 · 0 评论 -
L1和L2正则化区别
1. L1和L2的定义L1正则化,又叫Lasso Regression如下图所示,L1是向量各元素的绝对值之和L2正则化,又叫Ridge Regression如下图所示,L2是向量各元素的平方和2. L1和L2的异同点相同点:都用于避免过拟合不同点:L1可以让一部分特征的系数缩小到0,从而间接实原创 2017-09-07 20:47:22 · 4948 阅读 · 0 评论 -
深度学习各领域小结
优秀博客ML Structuring Your TensorFlow Models DEEP LEARNING GLOSSARY待学习专栏 | Momenta详解ImageNet 2017夺冠架构SENet多任务An Overview of Multi-Task Learning in Deep Neural Networks∗ 一箭N雕:多任务转载 2017-08-22 10:49:00 · 1101 阅读 · 0 评论 -
论文导读:面向卷积神经网络的卷积核冗余消除策略
摘要: 本篇论文针对卷积神经网络在训练阶段所需的大量存储与计算资源,提出了一种改进的冗余卷积核消除策略,精简每个卷积层中冗余的卷积核,进而降低模型训练开销,使模型训练过程从云端转移至本地成为可能。更多深度文章,请关注:https://yq.aliyun.com/cloud研究背景近几年来,卷积神经网络(Convolutional Neutral Network, CNN转载 2017-08-17 11:46:44 · 2178 阅读 · 0 评论 -
CNNdroid:在Android上利用GPU加速执行CNN(卷积神经网络)
该文章翻译自:CNNdroid: GPU-Accelerated Execution of Trained Deep Convolutional Neural Networks on Android原论文地址摘要智能设备和可穿戴设备都将受益于深度学习算法(比如CNN)的准确性和可扩展性。然而,性能和能耗等现实的问题使得在移动端设备上这类密集计算的算法变得非常受限。我们开发了转载 2017-08-17 11:23:18 · 2707 阅读 · 0 评论 -
[文献阅读]dropout as a bayesian approximation: representing model uncertainty in deep learning
剑桥大学Ghahramani发表在ICML16.【abstract】用于回归和分类的DL工具没有表示模型不确定性。bayesian模型有数学上完备的框架推导模型不确定性,但常有过高的计算代价。 文章将深度神经网络中的dropout训练理解为 深度高斯过程 中的近似贝叶斯推理,通过dropout NN建模不确定性,不影响计算复杂度和模型准确性。仔细研究了dropout表示不确定性的属性。转载 2017-08-16 17:43:58 · 2527 阅读 · 0 评论 -
ImageNet Classification with Deep Convolutional Neural Networks笔记
ImageNet Classification with Deep Convolutional Neural Networks 前言这是meeting report,关于AlexNet的一篇周报。写的不是很好,望大家谅解。PS: 争取每周都写一个周报,想在博客里留下一些自己的笔记。很久之前就有这样的想法,今天终于完成了,希望自己能坚持下来。come on!Abstr原创 2016-07-26 16:20:34 · 773 阅读 · 0 评论 -
TensorFlow在Windows 7上的详细安装步骤
今天着实被感动到了,TensorFlow官方更新了0.12RC版本,该版本支持Windows下的pip一键安装。是的,今天下午在开会前知道后,开完会立马安装了。不得不说,TensorFlow在过去的一周年里,一直只官方支持两个系统——Linux 和 Mac,说实话,我之前没有安装,就是因为Linux系统用的很不熟练。和我一样的举手,哈哈。而且看各种教程都是很复杂的配置,装起来到处都原创 2016-11-30 20:58:12 · 18466 阅读 · 0 评论 -
ipython notebook 的详细介绍
介绍ipython notebook¶1.简单介绍ipython notebook的安装和使用,在ubuntu上:sudo apt-get install ipython但是并不是所有的版本都支持notebook功能,本人的系统安装的是0.13的版本有notebook,但是有个重要的功能没有,什么功能等会再说,所以本人手动安装的ipython 1.1.0版本,你可以转载 2017-07-05 09:50:05 · 16646 阅读 · 0 评论 -
更改Anaconda下载源
这两天在装环境,直接安装的方式超级麻烦,所以我在想要不然就用anaconda,一键式,超级简单,方便。但是由于anaconda的源是境外的,所以我总是出现下载到一半就断了链接,或者速度很慢的情况(一般都是显示下载3个小时)。百度到大家都在使用清华或者豆瓣的镜像源,果然速度快了很多,下载时间大概就5分钟左右。下面我就简单介绍一下怎么操作:你在cmd中敲入以下命令:conda co原创 2017-06-24 11:33:59 · 2252 阅读 · 0 评论 -
深度神经网络概述:从基本概念到实际模型和硬件基础
目前,包括计算机视觉、语音识别和机器人在内的诸多人工智能应用已广泛使用了深度神经网络(deep neural networks,DNN)。DNN 在很多人工智能任务之中表现出了当前最佳的准确度,但同时也存在着计算复杂度高的问题。因此,那些能帮助 DNN 高效处理并提升效率和吞吐量,同时又无损于表现准确度或不会增加硬件成本的技术是在人工智能系统之中广泛部署 DNN 的关键。 本文转载 2017-06-01 21:41:04 · 5479 阅读 · 0 评论 -
将数据集做成VOC2007格式用于Faster-RCNN训练
0.文件夹名首先,确定你的数据集所放的文件夹名字,例如我的叫logos。(或者和voc2007一样的名字:VOC2007)1.图片命名虽然说图片名对训练没什么影响,但建议还是按VOC2007那样,如“000005.jpg”这种形式。至于图片格式,代码里是写的jpg。批量修改图片名字为VOC2007格式可以参考以下Matlab代码:[p转载 2017-05-31 22:05:17 · 630 阅读 · 0 评论 -
报错 ImportError: No module named model_selection 的解决办法
win10下运行了一段Python代码,出现了报错, 报错是ImportError: No module named model_selection。我定位代码到import sklearn.model_selection,我才知道原来我没有这个model。我在网上找了一下解决方法,原来是scikit-learn的版本太低。在anaconda中通过命令行查看sklearn的版本为 0.17.1原创 2017-06-04 22:54:01 · 18289 阅读 · 1 评论 -
K-means中的K值选择与初始点的选择
关于如何选择Kmeans等聚类算法中的聚类中心个数,主要有以下方法:1. 最简单的方法:K≈sqrt(N/2)2. 拐点法:把聚类结果的F-test值(类间Variance和全局Variance的比值)对聚类个数的曲线画出来,选择图中拐点3. 基于Information Critieron的方法:如果模型有似然函数(如GMM),用BIC、DIC等决策;即使没有似然函数,如KMe原创 2017-09-07 21:43:36 · 9294 阅读 · 0 评论 -
yolo回归型的物体检测
发现一篇讲的非常棒的文章,就直接搬到了我的博客上: YOLO全称You Only Look Once: Unified, Real-Time Object Detection,是在CVPR2016提出的一种目标检测算法,核心思想是将目标检测转化为回归问题求解,并基于一个单独的end-to-end网络,完成从原始图像的输入到物体位置和类别的输出。YOLO与Faster RCNN转载 2017-09-07 23:05:15 · 10564 阅读 · 6 评论 -
在Python 2.7即将停止支持时,我们为你准备了一份3.x迁移指南
目前,Python 科学栈中的所有主要项目都同时支持 Python 3.x 和 Python 2.7,不过,这种情况很快即将结束。去年 11 月,Numpy 团队的一份声明引发了数据科学社区的关注:这一科学计算库即将放弃对于 Python 2.7 的支持,全面转向 Python 3。Numpy 并不是唯一宣称即将放弃 Python 旧版本支持的工具,pandas 与 Jupyter noteb转载 2018-01-29 19:50:33 · 4287 阅读 · 0 评论 -
详解Fast R-CNN
论文出处见:http://arxiv.org/abs/1504.08083项目见:https://github.com/rbgirshick/fast-rcnnR-CNN的进化版,0.3s一张图片,VOC07有70的mAP,可谓又快又强。而且rbg的代码一般写得很好看,应该会是个很值得学习的项目。动机为何有了R-CNN和SPP-Net之后还要提出Fast RCNN(转载 2018-01-28 23:10:11 · 1121 阅读 · 0 评论 -
深度学习模型压缩方法综述(三)
前言在前两章,我们介绍了一些在已有的深度学习模型的基础上,直接对其进行压缩的方法,包括核的稀疏化,和模型的裁剪两个方面的内容,其中核的稀疏化可能需要一些稀疏计算库的支持,其加速的效果可能受到带宽、稀疏度等很多因素的制约;而模型的裁剪方法则比较简单明了,直接在原有的模型上剔除掉不重要的filter,虽然这种压缩方式比较粗糙,但是神经网络的自适应能力很强,加上大的模型往往冗余比较多,将一些参数剔除之后转载 2018-01-18 15:05:47 · 1400 阅读 · 0 评论 -
深度学习模型压缩方法综述(二)
前言上一章,将基于核的稀疏化方法的模型压缩方法进行了介绍,提出了几篇值得大家去学习的论文,本章,将继续对深度学习模型压缩方法进行介绍,主要介绍的方向为基于模型裁剪的方法,由于本人主要研究的为这个方向,故本次推荐的论文数量较多,但都是非常值得一读的。基于模型裁剪的方法对以训练好的模型进行裁剪的方法,是目前模型压缩中使用最多的方法,通常是寻找一种有效的评判手段,来判断参数的重要性,将不重要的conne转载 2018-01-18 15:04:06 · 860 阅读 · 1 评论 -
深度学习模型压缩方法综述(一)
前言目前在深度学习领域分类两个派别,一派为学院派,研究强大、复杂的模型网络和实验方法,为了追求更高的性能;另一派为工程派,旨在将算法更稳定、高效的落地在硬件平台上,效率是其追求的目标。复杂的模型固然具有更好的性能,但是高额的存储空间、计算资源消耗是使其难以有效的应用在各硬件平台上的重要原因。最近正好在关注有关深度学习模型压缩的方法,发现目前已有越来越多关于模型压缩方法的研究,从理论研究到平台实现,转载 2018-01-18 15:02:26 · 771 阅读 · 0 评论 -
CNN 模型压缩与加速算法综述
导语:卷积神经网络日益增长的深度和尺寸为深度学习在移动端的部署带来了巨大的挑战,CNN模型压缩与加速成为了学术界和工业界都重点关注的研究领域之一。前言自从AlexNet一举夺得ILSVRC 2012 ImageNet图像分类竞赛的冠军后,卷积神经网络(CNN)的热潮便席卷了整个计算机视觉领域。CNN模型火速替代了传统人工设计(hand-crafted)特征和分类器,不仅提供了一种端到端的处理方法,转载 2018-01-18 15:00:45 · 636 阅读 · 0 评论 -
jupyter notebook更换主题 步骤详解
最近在折腾自己的笔记本电脑,结果被Jupyter Notebook的自带主题亮瞎了眼,为了保护视力,还是换个对眼睛友好点的主题吧。在github上发现了一个jupyter-themes工具,可以通过pip安装,非常方便使用。接下来将详细介绍Jupyter-themes工具及如何为Jupyter Notebook更换主题安装jupyter-themes的命令行如下所示:pip ins原创 2018-01-31 21:09:28 · 34499 阅读 · 13 评论 -
matplotlib绘图中中文显示乱码问题的解决方案
实验环境是linux 16.10, Python3.6,其他平台应该也一样。没试过,大家可以去试试看,应该差不多。1. 正确下载字体文件simhei.ttf点击下载字体2. 将上面下载的文件copy到matplotlib里的对应目录,我的目录是~/anaconda3/lib/python3.6/site-packages/matplotlib原创 2018-01-07 21:36:14 · 1103 阅读 · 0 评论 -
修改Anaconda中的Jupyter Notebook默认工作路径
最初的Jupyter Notebook是默认路径,如下图所示:打开Windows的cmd,在cmd中输入jupyter notebook --generate-config如下图:可以看到路径为C:\Users……找到此路径修改jupyter_notebook_config.py文件 ,如下图所示:用VS code打开文件后,找到## The原创 2018-01-31 13:56:46 · 1368 阅读 · 0 评论 -
【干货】Inception经典架构对比
Inception 结构是卷积神经网络的经典架构之一,通过采用不同尺度的卷积核(1x1, 3x3, 5x5等),增强特征的多样性,从而提升网络性能。Inception包含Googlenet、Inception v2、Inception v3、Xception 等多个版本。本文一文带你了解个中究竟,横向对比Inception经典网络架构,文末附独家视频讲解,20分钟带你重温经典,你值得拥有~转载 2017-12-23 21:25:50 · 1483 阅读 · 0 评论 -
Deep Compression阅读理解及Caffe源码修改
PS:这是我见过关于Song Han的Deep Compression最详细的的文章,并且给出了原理介绍,实现代码。关于详细代码,请参见文中的github链接。特此推荐!特此推荐!特此推荐!---------------------------------------分割线---------------------------------------------转载 2017-12-12 20:13:09 · 804 阅读 · 0 评论 -
主流机器学习模型模板代码+经验分享[xgb, lgb, Keras, LR]
摘要最近打各种比赛,在这里分享一些General Model,稍微改改就能用的环境: python 3.5.2XGBoost调参大全: http://blog.youkuaiyun.com/han_xiaoyang/article/details/52665396 XGBoost 官方API: http://xgboost.readthedocs.io/en/latest/转载 2017-12-20 13:21:32 · 5901 阅读 · 0 评论 -
cs231n学习笔记-CNN-目标检测、定位、分割
1. 基本概念 1)CNN:Convolutional Neural Networks 2)FC:Fully Connected 3)IoU:Intersection over Union (IoU的值定义:Region Proposal与Ground Truth的窗口的交集比并集的比值,如果IoU低于0.5,那么相当于目标还是没有检测到) 4)ICCV:转载 2017-04-23 17:28:30 · 669 阅读 · 0 评论 -
cs231n学习笔记-CNN-目标检测、定位、分割
1. 基本概念 1)CNN:Convolutional Neural Networks 2)FC:Fully Connected 3)IoU:Intersection over Union (IoU的值定义:Region Proposal与Ground Truth的窗口的交集比并集的比值,如果IoU低于0.5,那么相当于目标还是没有检测到) 4)ICCV:转载 2017-04-22 20:36:21 · 483 阅读 · 0 评论 -
XGBoost-Python完全调参指南-介绍篇
XGBoost-Python完全调参指南-介绍篇 在analytics vidhya上看到一篇<Complete Guide to Parameter Tuning in XGBoost inPython>,写的很好。因此打算翻译一下这篇文章,也让自己有更深的印象。具体内容主要翻译文章的关键意思。原文见:http://www.analyticsvidhya.com/blog/2转载 2017-03-31 19:43:14 · 715 阅读 · 0 评论 -
XGBoost-安装(Windows/VS2015)
XGBoost-安装(Windows/VS2015)昨天想装theano的时候,误删了之前的一些Python包,导致xgboost无法使用。索性重新安装了anaconda平台,方便自己后续的使用。 Anaconda是python科学计算的集成。使用起来给人matlab的感觉。并且预装了numpy,scipy,matplotlib,pandas, scikit-learn等多个常转载 2017-03-31 19:40:05 · 910 阅读 · 0 评论 -
pandas学习(一)
最近在做JData算法大赛,作为一个新手,第一次参加这样的比赛,还处于没入门的状态,但是还是希望可以慢慢做,慢慢玩数据,来提高自己。其中有一个数据文件——JData_Action_1604, 这是一个用户行为文件,我看在数据的时候,第一个用户User_id——100259在短短的时间内就出现了很多的交互(行为)。为此,我想提取出在JData_Action_1604文件中有关User_id—原创 2017-03-31 13:00:42 · 541 阅读 · 0 评论 -
数据城堡参赛代码实战篇(一)---手把手教你使用pandas
数据城堡参赛代码实战篇(一)---手把手教你使用pandas小编们最近参加了数据城堡( http://www.pkbigdata.com/ )举办的“大学生助学金精准资助预测 ”比赛,分组第19名的成绩进入了复赛,很激动有木有!在上一篇文章中,小编带大家回顾了参赛的心路历程,虽然看上去生动有趣,十分轻松,但是小编们在背后也是付出了不少的汗水呀。本篇,小编文文将带你一起分析如何用pa转载 2017-03-23 21:48:19 · 4075 阅读 · 14 评论 -
Python2.x和Python3.x区别
最近总是遇到一些烦心的事情,比如用Python3.5来写一些代码,有些不太懂的地方,就去网上找答案,却发现很多都是基于python2.x的。今天我就来说点遇到的一些问题。Unicode 字符串 在Python2中,普通字符串是以8位ASCII码进行存储的,而Unicode字符串则存储为16位unicode字符串,这样能够表示更多的字符集。使用的语法是在字原创 2017-03-13 22:06:02 · 1555 阅读 · 0 评论 -
DataCastle[猜你喜欢]赛事算法分享
DataCastle[猜你喜欢]赛事算法分享关于竞赛DC的小伙伴们大家好,我是Yes,boy! ,来自东北大学计算机学院。在猜你喜欢推荐系统竞赛中,很幸运以7.89465的得分取得第一名,看到大家在群里对推荐系统的热情很高,所以在这里我简单介绍下竞赛中我的思路。本次比赛的赛题背景是给出了约3400万条数据,包含一个商品网站站内顾客在某一时刻对某一个商品的打分值,分值范围为1至5转载 2017-03-29 09:09:38 · 876 阅读 · 0 评论 -
Python多进程编程入门
Python多进程编程入门 多进程(multiprocessing)模块是在 Python 2.6 版本加入的。它最初由 Jesse Noller 和 Richard Oudkerk 在PEP 371 中定义。multiprocessing 模块生成进程的方式就和你使用 threading 模块生成线程是一样的。但是在这里,因为你使用的是多进程,所以你可以规避全局解释锁(GIL),充分转载 2017-03-28 21:16:49 · 1146 阅读 · 0 评论 -
一文学会 Python 多线程编程
一文学会 Python 多线程编程 Threading 模块从 Python 1.5.2 版开始出现,用于增强底层的多线程模块thread 。Threading 模块让操作多线程变得更简单,并且支持程序同时运行多个操作。注意,Python 中的多线程最好用于处理有关 I/O 的操作,如从网上下载资源或者从本地读取文件或者目录。如果你要做的是 CPU 密集型操作,那么你需要使用 Py转载 2017-03-28 21:08:54 · 2753 阅读 · 0 评论 -
十分钟入门Matplotlib
十分钟入门Matplotlib 数据的处理、分析和可视化已经成为 Python 近年来最重要的应用之一。这种现象又进一步引出“大数据”分析等类似的话题,而大数据分析在人们所能预见的诸多领域内都有广泛应用,这其中就包含笔者个人感兴趣的机器学习。Python 在处理数据、分析数据以及数据可视化方面拥有很多功能强大的工具,这也是 Python 在科学领域中能够迅速发展的一个主要原因。在接转载 2017-03-28 20:56:10 · 2699 阅读 · 0 评论 -
数据挖掘笔试题(二)
数据挖掘笔试题(二) 1、深度学习是当前很热门的机器学习算法。在深度学习中,涉及到大量矩阵相乘,现在需要计算三个稠密矩阵A,B,C的乘积ABC,假设三个矩阵的尺寸分别为m*n,n*p,p*q,且mA、A(BC)B、(AB)CC、(AC)BD、所有效率都相同解析:首先根据基原创 2017-03-28 09:57:53 · 2051 阅读 · 0 评论 -
【sklearn】数据预处理(一)
一般来说,我们搜集到的数据因为种种原因都会出现缺失值,通常而言,我们有几种常见的解决方法,一种解决方法是直接去掉这些包含缺失值的行,不得不说这样的做法或多或少会影响到我们的后续的数据分析,特别是对数据量小的情况。因此我们要采用更好的策略来填充缺失的数据,例如通过已知的数据来推测。Imputer提供了基本的填充方法,例如使用均值或者中位数填充,当然也有人使用众数,具体的你可以根据你的数据来定。原创 2017-03-11 15:35:50 · 676 阅读 · 0 评论