- 博客(125)
- 资源 (9)
- 收藏
- 关注
转载 Hadoop经典书籍资料收藏(35本)转
原文地址:http://www.hadoopor.com/thread-5128-1-2.html 1.”Hadoop.Operations.pdf.zip”http://vdisk.weibo.com/s/vDOQs6xMAQH62.”Hadoop权威指南(中文版)(带书签).pdf”http://vdisk.weibo.com/s/wxJYuVE573j3...
2018-07-04 18:42:06
10250
原创 深刻理解Python中的元类(metaclass)
深刻理解Python中的元类(metaclass) PEP 3115 – Metaclasses in Python 3000第一篇文章中我执行后有错误的代码是这一段:def upper_attr(future_class_name, future_class_parents, future_class_attr): '''返回一个类对象,将属性都转为大写形式''' ...
2018-06-21 23:51:04
694
原创 理解机器学习中的VC维
VC维的来龙去脉Computational Learning Theory - VC Dimension 这篇文章中有几个重要的链接要仔细看一下
2018-06-12 14:20:09
1327
原创 WinRAR去除广告
WinRAR 5.40 去除广告方法,屏蔽广告弹窗方法,亲测有效winrar5.50去广告教程(仅供学习使用)[Windows] 自己动手 winRAR 去广告 删代码
2018-06-11 12:20:21
6685
原创 2017年诺贝尔生理学或医学奖
2017年诺贝尔奖诺贝尔奖官方解读最新生理医学奖:睡觉和清醒背后的分子机制看完今年的诺贝尔奖,你还敢让孩子熬夜吗?
2018-06-10 16:18:21
3187
原创 Weka在wikispaces上相关内容整理
1. Weka Mailing ListThe WEKA Mailing list can be found here:List for subscribing/unsubscribing to the listArchives (Mirror 1, Mirror 2) for searching previous posted messagesBefore posting,...
2018-06-10 12:52:26
360
原创 Ubuntu下多个Python版本共存
一个方法是使用virtuallen环境,另一方法是使用pyenvvirtuallen使用virtuallen管理多个python版本,需要先安装多个python环境1. ubuntu下源代码安装python从http://www.python.org/download/下载源文件。编译安装tar zxvf Python-2.7.6.tgzcd Python-2.7.6...
2018-06-10 10:20:55
4808
转载 BeautifulSoup的输出
格式化输出BeautifulSoup中有内置的方法prettfy()来实现格式化输出。比如:from bs4 import BeautifulSoup html_markup = """<p class="ecopyramid"> <ul id="producers"> <li class="producerlist"&
2018-06-09 18:45:45
2165
原创 Python中过滤Windows文件名中的非法字符
网上有三种写法: 第一种(所有非法字符都不转义):def setFileTitle(self,title): fileName = re.sub('[\/:*?&amp;amp;amp;quot;&amp;amp;amp;amp;lt;&amp;amp;amp;amp;gt;|]','-',title)#去掉非法字符 self.file = open(fileName + &
2018-06-09 14:52:01
12511
1
原创 导入Weka源代码到Eclipse中
1、下载weka3.7,解压其中的weka-src.jar的文件,包含lib,src,META-INF三个文件夹和另外两个文件;2、在Eclipse下新建java project,命名为weka,在src下新建名为weka的包;3、在此项目下import–>File System–>选择…/weka/src/main/java/weka,并全部导入; [第三项其他的教程略有不...
2018-06-02 22:09:27
904
转载 文档编码问题
查看及修改文件的编码格式 ANSI是什么编码?https://wenku.baidu.com/view/44ecbe35aa00b52acec7ca10.htmlWindows 记事本的 ANSI、Unicode、UTF-8 这三种编码模式有什么区别?Sublime Text 3技巧:支持GB2312和GBK编码...
2018-06-01 09:33:36
374
转载 Regression Tree 回归树
1. 引言AI时代,机器学习算法成为了研究、应用的热点。当前,最火的两类算法莫过于神经网络算法(CNN、RNN、LSTM等)与树形算法(随机森林、GBDT、XGBoost等),树形算法的基础就是决策树。决策树因其易理解、易构建、速度快的特性,被广泛应用于统计学、数据挖掘、机器学习领域。因此,对决...
2018-05-26 16:46:12
2934
1
转载 将小文件嵌入到html页面中的方法
data:image/jpg;base64Data URI scheme。Data URI scheme是在RFC2397中定义的,目的是将一些小的数据,直接嵌入到网页中,从而不用再从外部文件载入。比如上面那串字符,其实是一张小图片,将这些字符复制黏贴到火狐的地址栏中并转到,就能看到它了。 在上面的Data URI中,data表示取得数据的协定名称,image/png 是数据类型名称...
2018-05-24 12:51:24
3370
原创 Java的解释执行与编译执行
理解Java的几个编译器前端编译器:把.java文件转变成.class文件。包括Sun的Javac、Eclipse JDT中的增量式编辑器(ECJ)后端运行期编译器(JIT编译器,Just In Time Compiler):把字节码转成机器码。包括HotSpot VM的C1、C2编译器静态提前编译器(AOT编译器,Ahead Of Time Compiler):把*.java编译成本...
2018-05-16 22:22:58
5406
原创 Weka中的有监督的离散化方法
参考:机器学习-变量离散之MDLP对应分析Weka中weka.filters.supervised.attribute.Discretize 涉及的其他类包括weka.filters.Filter 分析的宏观代码Discretize disc=new Discretize()disc.setInputFormat(data)Instances afterDiscretize=Fil...
2018-05-11 15:33:53
4008
原创 HD Tune中的各种信息表示的含义
Benchmark基准选项主要是用来测试硬盘的读写速度,可以查看硬盘的性能,选择读取,点击开始就可以开始测试。有两项因素影响硬盘的性能,「存取时间(access time)」与「平均数据传输率(data transfer rate)」。「存取时间」愈短愈好,指得是硬盘对于我们发出的命令到全动作完成所需要的时间,自然是越小越好。由于硬盘每天都有着成千上万次的读写动作,这项因素就显得格外重...
2018-05-02 18:34:38
18194
原创 研究生学习生活规划
参考: 研究生期间设想与规划如何确定适合自己的研究领域?(小故事)有一个草坪铺路的故事可以用来回答这个问题。保护草坪是很难的,因为草坪上的路往往并不是按人的方便性来修的。有一次一个设计师承接了一个项目,交付使用后在这个建筑物的周围全部铺上了草坪,没有路,任人去踩,几个月后,草坪上就分明出现了几条道:有粗有细,然后他就此基础上修路,也有粗有细,结果可想而知。在开始的时候,你可以没有...
2018-05-01 19:07:25
3227
原创 Python调用Java与Java中调用Python
Python中调用Java参考: JPype:实现在python中调用JAVA1.安装首先系统中Python和Java版本最好都是32位或者都为64位,否则可能出现错误。pip install jpype1可能需要安装VC for python27:https://www.microsoft.com/en-us/download/confirmation.aspx?id=...
2018-05-01 10:18:05
10350
原创 如何蹭网不被发现
1.方法一出于某种原因,你可能不想别人通过局域网网上邻居里看到自己的电脑,其实你可以隐藏自己的电脑,让别人在局域网中找不到你。下面是操作方法:单击“开始→运行”,在打开的“运行”对话框中输入“cmd”打开命令行窗口,输入“net config server /hidden:yes”,再回车就可以了。这样别人就无法从网上邻居中直接看到你的计算机,只有通过在资源管理器地址栏中输入“\计算机名”...
2018-05-01 08:15:57
25591
2
原创 Weka中ROC和AUC通过调用API实现
Weka中实现计算ROC的是ThresholdCurve类的getCurve函数(1)getCurve函数@param 一般是十折交叉得到的predictions @param 正例的类标记,多元分类问题,设置某个类别为正例,其他类别就是负例 @return datapoints if (pred.actual() == classIndex) { totPo...
2018-04-30 22:38:04
2130
原创 Weka中的Evaluation类源代码分析
使用的数据是最简单的weather.nominal.arff,使用的分类模型是NaiveBayes1.在构造函数中进行了如下操作:m_ClassPriors[numClasses]统计构造函数传入的data的各个类的先验概率,有一个平滑处理,在统计之前每个m_ClassPriors[i]都赋值为1,防止出现某个类先验概率为0的情况出现。m_MarginCounts = new doub...
2018-04-30 20:09:39
786
原创 第三章——发现群组
cnblog的订阅源:http://feed.cnblogs.com/blog/sitehome/rss cnblog的首页:https://www.cnblogs.com/ 将两者用浏览器打开后,可以发现有很多的相似之处,订阅源中的每一个entry就对应首页中的一篇博客...
2018-04-27 21:11:52
254
原创 Java内存的相关问题
为什么java获取的最大堆内存和设置的不一致Java 内存溢出(java.lang.OutOfMemoryError)的常见情况和处理方式总结Sublime Text 3 配置java运行环境Java OutOfMemory异常清单 —— 在自己的机器上制造内存溢出...
2018-04-27 16:32:59
158
原创 VisualVM——Java程序监控工具
自从 JDK 6 Update 7 以后已经作为 Oracle JDK 的一部分,位于 JDK 根目录的 bin 文件夹下(jvisualvm.exe),无需安装,直接运行即可。使用SizeOf测定JVM中对象占用内存...
2018-04-27 14:41:11
206
原创 第九章 高阶分类:核方法与SVM
用Bing Map服务代替Yahoo的Geocoding API Bing Map的相关网站: Bing Map 开发者中心 publice21@outlook Bing Map 的MSDN Bing Map 的MSDN 另一个文档 根据Bing Map修改后的部分代码:BingKey="AudmvxyrHM35ktbN5bLBPtVL24Yst22RTfIyRSxzr45r7aY9...
2018-04-27 12:26:45
361
原创 Weka分布式实验
File协议 startRemoteEngine.shjava -Xmx1024m -classpath ../db_drivers/mysql-connector-java-5.1.46.jar;remoteEngine.jar;../weka3.7.13.jar -Djava.security.policy=remote.policy weka.experiment.RemoteE...
2018-04-26 16:39:37
589
原创 Ubuntu安装MySQL
sudo apt-get install mysql-server会提示你设置密码,如果安装时没有设置密码的解决办法参考ubuntu安装mysql 时未提示输入密码udo apt isntall mysql-clientsudo apt install libmysqlclient-dev安装成功后可以通过下面的命令测试是否安装成功:sudo netstat -tap |...
2018-04-26 10:46:42
181
原创 Ubuntu服务器安装桌面
Ubuntu14.04 server 安装桌面从零开始配置Ubuntu Server 14.04 图形界面、Caffe安装及远程连接Ubuntu 16.04 server 图形界面注意最后修改启动项 如何默认不启动桌面,等需要时再启用。 /etc/default/grub GRUB_CMDLINE_LINUX_DEFAULT=”” 改为 “text”,然后upda...
2018-04-25 12:54:34
4916
原创 Xshell5评估期已过
正在使用的xshell 5不能使用,提示xshell 5评估期已过,重新安装还是不行。其实xshell 5有免费版的,即Home & school 版本。卸载原程序,下载安装免费版本的xshell 5即可。免费版本的链接:http://www.netsarang.com/download/free_license.html...
2018-04-25 12:38:08
1497
原创 UCI数据集转化为Arff数据集
以Adult数据集为例 将adult.data.txt文件改为csv格式,用Weka Explorer打开adult.data.csv然后保存为arff文件。 将adult.test.txt文件也作如上操作,会出现错误: |1x3 Cross validator25, Private, 226802, 11th, 7, Never-married, Machine-op-inspc...
2018-04-25 07:38:43
1804
原创 计算机辅助翻译CAT——OmegaT
轻松愉快的辅助翻译工具OmegaT的简单使 OmegaT - 开源跨平台的电脑辅助翻译工具软件入门与下载 (Win/Mac/Linux)
2018-04-18 13:44:56
2080
转载 ROC and AUC
参考: ROC和AUC介绍以及如何计算AUC 多分类下的ROC曲线和AUCROC曲线首先ROC分析的是二元分类模型,也就是输出类别只有两种值的分类模型。对于其他的多类分类模型可以做相应的转换,本文后面再作分析。ROC曲线的特点:ROC曲线的横轴是False postive rate,纵轴是True positive rate一个特定分类模型在一个测试数据集上只会得到一个FP...
2018-04-17 13:23:29
431
原创 本科论文查重
降低重复率的方法(1) 网上的资源都是相互有着关联的,要是直接把原话拿来用是很容易就被检查出来的。可以在写的时候变化一下,换个关键词,用意思相同的词来替换原文中的词语。也可以变一下句子的结构,用自己的话重新改写一下,这样一来,意思虽然是一样的,但是论文查重就不会检查出飘红来,再不行的话,可以直接把飘红的那句删掉。要是非得要用的话,可以借助一些翻译软件,就是说你可以把那段话先翻译成英语,然后自己...
2018-04-16 21:02:43
1351
原创 一个简体字对应多个繁体字的例子
干:對應三個繁體字:(干)涉,(乾)燥,(幹)部; 后:對應兩個繁體字:(後)面,皇(后); 系:對應三個繁體字:唔(系),關(係),聯(繫); :對應兩個繁體字:(歷)史,日(曆); :對應兩個繁體字:時(鐘),(鍾)意; 板:對應兩個繁體字:老(闆),木(板); 表:對應兩個繁體字:手(錶),外(表); 丑:對應兩個繁體字:(醜)怪,子(丑)寅卯; 范:對應兩個繁體字:模(範)...
2018-04-15 22:51:07
5801
原创 爬取JS动态加载的页面
参考知乎:https://www.zhihu.com/question/21471960/answer/154098407 爬取网页上的评论:http://music.163.com/#/song?id=86375 请求评论数据的参数:params 和 encSecKey ,同时在Name栏目可以清楚地看到处理该参数的 js 文件为 core.js 美化JS代码后搜索这两个参数 ...
2018-04-14 19:30:37
15302
标准模板库自修教程与参考手册 STL进行C++编程.zip
2019-07-11
《Python深度学习》中英文及源代码2018
2018-11-18
Deep Learning with Python-Francois Chollet配套源代码
2018-11-18
Deep Learning with Python-Francois Chollet
2018-11-18
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人