- 博客(86)
- 资源 (1)
- 收藏
- 关注
原创 计算广告与机器学习-技术共享平台
计算广告与机器学习博客地址:http://www.52caml.com/大家好,欢迎来到CAML-技术共享平台!CAML平台致力于整理和分享互联网广告领域的核心问题和解决方案。博主水平有限,期望能与对此话题感兴趣的朋友一起学习、交流、探讨与分享。众所周知,机器学习是一门交叉性很强的学科,而我们这里主要想分享和探讨的是如何利用机器学习这把利器,有效地解决在线广告领域中的学习问题 ...
2016-03-29 09:09:00
2181
原创 一些代码20140717
###################################################主程序逻辑#select data# select_hive_sql通过查询语句向表中插入数据,这里使用了OVERWRITE关键字,因此之前分区中的内容会被覆盖掉。# 如果没有OVERWRITE或者使用INTO关键字替换掉它的话,Hive会以追加的方式写入数据而不会覆盖掉之前已经存
2014-07-18 00:37:07
789
转载 1. awk, gawk命令使用
简介awk是一个强大的文本分析工具,相对于grep的查找,sed的编辑,awk在其对数据分析并生成报告时,显得尤为强大。简单来说awk就是把文件逐行的读入,以空格为默认分隔符将每行切片,切开的部分再进行各种分析处理。awk有3个不同版本: awk、nawk和gawk,未作特别说明,一般指gawk,gawk 是 AWK 的 GNU 版本。awk其名称得自于它的创始人 Alfr
2014-07-15 19:15:31
5364
转载 1. 【Java基础】jar, javac, java的具体使用方法
Jar:用法:jar {ctxui}[vfm0Me] [jar 档案] [清单档案] [进入点] [-C 目录] 档案 ...选项: -c 建立新的归档 -t 列出归档的目录 -x 从归档中撷取已命名的 (或所有) 档案 -u 更新现有归档 -v 在标准输出中产生详细输出 -f 指定归档档案名称 -m 包含指定清单档案中的清单
2014-07-15 16:16:32
746
原创 Linux错误集锦
1. [Errno 14] PYCURL ERROR 7 - "couldn't connect to host" 本机在服务器上的一个节点用
2014-05-14 09:33:17
799
原创 【deep learning】Theano文档学习
1. thenao中的共享共享变量总结:import theanoimport theano.tensor as Tfrom theano import functionfrom theano import sharedstate = shared(200) # 使用shared定义共享变量,初始化为200inc = T.iscalar('inc')# 定义累加器accumul
2014-05-08 15:05:05
2151
原创 One-hot编码:Python sklearn CTR实验
import numpy as npfrom sklearn.preprocessing import OneHotEncoderfrom numpy import *import MySQLdbconn = MySQLdb.connect(host='localhost', user='root', passwd='Zhouy2008', port = 3306)cursor =
2014-05-03 15:10:23
4648
原创 sklearn.metrics中的评估方法介绍
1. sklearn.metrics.auc(x, y, reorder=False):计算AUC值,其中x,y分别为数组形式,
2014-04-30 17:06:36
29170
2
转载 PR,ROC,AUC计算方法
受试者工作特征曲线 (receiver operating characteristic curve,简称ROC曲线),又称为感受性曲线(sensitivity curve)。得此名的原因在于曲线上各点反映着相同的感受性,它们都是对同一信号刺激的反应,只不过是在几种不同的判定标准下所得的结果而已。接受者操作特性曲线就是以虚报概率为横轴,击中概率为纵轴所组成的坐标图,和被试在特定刺激条件下由于采
2014-04-30 16:53:21
3743
转载 ROC、AUC、PR等计算方法
受试者工作特征曲线 (receiver operating characteristic curve,简称ROC曲线),又称为感受性曲线(sensitivity curve)。得此名的原因在于曲线上各点反映着相同的感受性,它们都是对同一信号刺激的反应,只不过是在几种不同的判定标准下所得的结果而已。接受者操作特性曲线就是以虚报概率为横轴,击中概率为纵轴所组成的坐标图,和被试在特定刺激条件下由于采
2014-04-30 16:18:40
8269
转载 windows安装pip
1、添加python的环境变量path = C:\Python27此步骤可实现在命令行下,不用进入 Python 目录即可执行 python.exe2、下载 setuptools注意对应 Python 的版本,完成后运行 exe 即可完成安装setuptools-0.6c11.win32-py2.7.exehttp://pypi.python.org/pypi/
2014-04-27 09:53:34
757
转载 0.python:scikit-learn基本用法
经Edwin Chen的推荐,认识了scikit-learn这个非常强大的python机器学习工具包。这个帖子作为笔记。(其实都没有笔记的意义,因为他家文档做的太好了,不过还是为自己记记吧,为以后节省若干分钟)。如果有幸此文被想用scikit-learn的你看见,也还是非常希望你去它们的主页看文档。主页中最值得关注的几个部分:User Guide几乎是machine learning的索引,各
2014-04-24 19:25:23
2151
转载 Python机器学习工具箱
Python在科学计算领域,有两个重要的扩展模块:Numpy和Scipy。其中Numpy是一个用python实现的科学计算包。包括:一个强大的N维数组对象Array;比较成熟的(广播)函数库;用于整合C/C++和Fortran代码的工具包;实用的线性代数、傅里叶变换和随机数生成函数。 SciPy是一个开源的Python算法库和数学工具包,SciPy包含的模块有最优化
2014-04-24 16:28:02
2047
原创 第1章:Python基本对象
1. 字符串str(), repr(), format()可以将非字符串值转化为字符串形式,例如x = 3.4print str(x) # 输出 '3.4'print format(x, '0.5f') # 输出'3.40000'name = raw_input('please input your name:')# 在Python3中,raw_input()函数叫
2014-04-23 22:46:47
682
转载 centos 安装numpy,scipy,scikit-learn
之前需要下载numpyCentOSにpython 2.7.3をインストールする手順CentOS 6.3にPython 2.7.3をインストールしてひと通りの環境を整える手順を書きます。Python 2.7.3のインストールcd srcwget http://www.python.org/ftp/python/2.7.3/Python-2.7.3.tgztar zxv
2014-04-23 13:16:46
1732
转载 deb包转化成rpm包
转载▼ deb文件格式本是ubuntu的安装文件,那么我想要在fedora中安装,需要把deb格式转化成rpm格式,我们用skype举例:1.下载转换工具alien_8.78.tar.gz2.deb转化成rpm例:我们要安装skype-debian_2.0.0.68-1_i386.deb1.下载 alien_8.78
2014-04-23 10:12:14
2784
转载 计算广告学 学习资料
学习课程计算广告学 - 刘鹏 http://study.163.com/course/introduction.htm?courseId=321007#/courseDetail第一期百度计算广告学沙龙 http://www.youku.com/playlist_show/id_20672162.html第二期百度计算广告学沙龙
2014-02-06 20:59:12
1060
转载 深度学习 学习资料
深度学习,是当前热门的机器学习领域。 最近开始想系统学习一下, 整理了一些网上学习资料, 也供有共同兴趣的朋友参考。如果有好的推荐,也欢迎给我留言。学习网站1. Deep Learning 101 http://markus.com/deep-learning-101/?utm_campaign=Manong_Weekly_Issue_11&utm_med
2014-02-06 20:56:55
3254
转载 boost安装(本机是为了安装 机器学习工具包shark,而安装boost的)
windows下boost怎样安装与使用说明?安装VS2010第1步:先从官网(www.boost.org)下载最新版的BOOST源码,如图所示随便下哪个都行,我这里下的是82M的那个第2步:编译源代码(放心.这里是傻瓜式的操作,很容易操作)(本机下载的是boost_1_55_0.zip, zhouy)(1)先把源代码放在D盘,例如 D:\InstalledPr
2014-01-05 09:45:41
1326
转载 机器学习那些事
[转载]机器学习的那些事已有 2254 次阅读 2012-12-25 11:49 |个人分类:计算机科学|系统分类:论文交流|关键词:机器学习【原题】A Few Useful Things to Know About Machine Learning【译题】机器学习的那些事【作者】Pedro Domingos【译者】刘知远【说明】译文载于《中国计算机学会通讯》 第
2013-12-26 08:51:04
1690
转载 开源机器学习库
原文地址:C++的机器学习开源库作者:webbery508 一、c++开源机器学习库1)mlpack is a C++ machine learning library.2)PLearn is a C++ library aimed at research and development in the field of statistical machine learn
2013-12-23 18:49:25
1975
转载 大牛们的blog (人工智能与机器学习)
大牛们的blog (人工智能与机器学习)国外人工智能界牛人主页以前转过一个计算机视觉领域内的牛人简介,现在转一个更宽范围内的牛人简介:http://people.cs.uchicago.edu/~niyogi/http://www.cs.uchicago.edu/people/http://pages.cs.wisc.edu/~jerryzhu/
2013-12-23 18:14:30
1859
原创 R for Centos安装步骤
转载地址:http://blog.sina.com.cn/s/blog_551d7bff0101423f.html由于希望在Hadoop集群上配置RHadoop,自然需要在每个服务器节点上安装R语言。在安装过程也碰到了一些小问题,因此记录一下。 首先服务器系统版本为centos5.6,R版本为2.13.2。下面是安装步骤: 首先上传文件:rz -e
2013-12-16 16:25:29
1852
转载 *.tar.gz文件包安装
linux tar.gz安装方法 转载地址: http://baile8410.iteye.com/blog/546517linux下解压tar.gz文件 下面所所有操作,后面有所有步骤说明 [yonghu@localhost ~]# su root 口令: [root@localhos
2013-12-16 15:47:06
1035
转载 统计机器学习的理解
目前机器学习的一个比较热门的方向是统计机器学习(另外一个可能是图模型,按照Jordan的说法是统计机器学习属于频率主义,而图模型属于贝叶斯主 义), 对于每一个做统计机器学习的研究者来说,他们大致可以分为两类:一类做统计学习理论相关工作,如泛化界、约简或一致性;一类做优化算法,如支持向量机、 Boosting等。作为一个纯统计机器学习的学者来说,我想这两块内容都得了解。优化算法的门槛低点,可能比较
2013-12-13 11:15:58
1182
原创 数据挖掘/分析前的数据整理方法
这里谈不上数据预处理方法,只是数据的导入、导出,以及格式的转换、(一或多个)分隔符等相关问题1. 一条样本/记录中含有多个分隔符的处理方法:(1). 对于小数据集一个有效的方法是: ① 将有多个分隔符的数据 复制 到word文章,将多个分隔符转化为同一个分隔符;② 开始 ---> 查找替换 ---> 替换 ---> 查找内容(如果是空格,直接按一下空格键;如果是制表符等需要使用
2013-12-11 21:06:41
1618
原创 [MOOC学习笔记]机器学习基石 Lecture02 Learning to Answer Yes/No
最近,Cousera公开课上又多了一门优质的ML课程,尤其对于华语圈的朋友是学习机器学习的福音。由于本人之前对ML有一定的学习和理解,所以从一个观察者or评论者的角度,来看林老师讲的ML课程,客观的评价是,讲的非常清楚,没有国内大学ML相关课程的照本宣科,问题的引入、算法的描述以及推理都很清楚,非常值得好好学习,不管是刚接触ML的朋友,还是有一定ML经验的朋友。本次Machine Lear
2013-12-07 23:09:25
1351
原创 [MOOC学习笔记]机器学习基石 Lecture01 The Learning Problem
1. 首先:关于ML的几个解读ML:acquiring skill with experience accumulated/computed from data.skill improve some performance measure(e.g. prediction accuracy)ML: improving some performance measure with expe
2013-11-27 16:14:05
1834
转载 R语言与数据挖掘学习笔记(常用的包)
今天发现一个很不错的博客(http://www.RDataMining.com), 博主致力于研究R语言在数据挖掘方面的应用,正好近期很想系统的学习一下R语言和数据挖掘的整个流程,看了这个博客的内容,心里久久不能平静。决定从今天 开始,只要晚上能在11点之前把碗洗好,就花一个小时的时间学习博客上的内容,并把学习过程中记不住的信息记录下来,顺便把离英语四级的差距尽量缩小。下面列出了可用于
2013-11-27 13:50:43
1146
转载 基于VRM(访问者关系管理)的RTB(实时竞价)
凌晨,梦芭莎精准营销总监。2006年至2007年从事B/S结构程序开发工作;2008年正式投身网络营销的研究及其相关实践与应用;2010年进入梦芭莎参与企业级别的搜索营销工作;现阶段工作主要以大数据为基础,整合SEO、SEM、RTB来推动精准化网络营销,从而达到增强用户体验、积淀品牌影响力、和提高流量转化率的效果。希望能够与更多的同行交流关于精准营销话题,QQ:68590459。—————
2013-11-27 13:49:02
1765
转载 强化学习算法介绍(Reinforcement Learning and Control)
在之前的讨论中,我们总是给定一个样本x,然后给或者不给label y。之后对样本进行拟合、分类、聚类或者降维等操作。然而对于很多序列决策或者控制问题,很难有这么规则的样本。比如,四足机器人的控制问题,刚开始都不知道应该让其动那条腿,在移动过程中,也不知道怎么让机器人自动找到合适的前进方向。另外如要设计一个下象棋的AI,每走一步实际上也是一个决策过程,虽然对于简单的棋有A*的启发式方法,但在
2013-11-27 13:47:40
9590
原创 R技术、函数知识点总结
1. rbind(), cbind(): 构造、合并vector 或matrix为一个矩阵:cbind(1, 1:10) ----默认列合并, rbind(1, 1:10) ----行合并(or构造)
2013-11-26 19:41:31
8293
转载 机器学习经典论文
源地址: http://suanfazu.com/discussion/68/机器学习经典论文survey合集#0-tsina-1-13801-397232819ff9a47a7b7e80a40613cfe1感谢分享Active LearningTwo Faces of Active Learning, Dasgupta, 2011Active Learning
2013-11-23 23:22:49
3435
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人