MLOSS跟MULAN

刚开始整理整个硕士阶段的东西,首先弄出来的是开源多类标挖掘平台MULAN,google一下“MLKD Learning From Multi-Label Data”就行,具体网址是http://mulan.sourceforge.net。MULAN是基于weka3.7以上版本开发的,我是使用3.7.4,上手还是比较快,里面的算法都是比较新,最重要的是它们号称state of art。MULAN的paper是published在JMLR 2011上面,名字叫“MULAN: A Java Library for Multi-Label Learning”。JMLR算是顶级期刊了。这篇文章令我触动最深的是它的引文“The Need for Open Source Software in Machine Learning”,JMLR 2007这篇文章,大体说的就是埋怨各大ml researchers写完文章发表完就算,不公布程序,严重阻碍后来人的研究,所以发起MLOSS(machine learning open source software)项目,它鼓励paper作者发布对应的源程序,好让后来人踏着前人的尸体,爬得更高。MLOSS具体网址是http://mloss.org/和http://jmlr.csail.mit.edu/mloss/。MULAN就是MLOSS下的一个项目。
    说实话,搞ML算法研究的,主要问题是对比算法需要费九牛二虎之力才能弄出来,如果自己写的,对不对都不知道,加上各种参数设置,不是一般的烦死,重点是少有结果可以重现!里面的故事我不知道,也不想知道,因为我已经不弄research了,只想整理一下之前工作,好让后来人踏着我的尸体爬得更高。
    MULAN的使用也就不多说了,好好看一下它的documents就行。值得一提的是mailing list的重要性,那里是别人提问作者回答的地方,虽然垃圾问题比较多,当遇到问题时好好找一下应该能找到答案。例如,我之前想知道TMC2007的500个属性版本的数据集是怎样弄出来的,答案就在mailing list,是用CHI选取前500个特征,是有论文推荐该方法的,可以参看两篇论文Tsoumakas G, Vlahavas I. Random K-labelsets: An Ensemble Method for Multilabel Classification[C]. In Proceedings of the 18th European Conference on Machine Learning, 2007: 406–417.和Rogati M, Yang Y M. High-performing Feature Selection for Text Classification[C]. Proceedings of the 11th international conference on Information and knowledge management, 2002:659-661.
中文名: Python参考手册 (第4版) 原名: Python Essential Reference, 4th Edition 作者: David M.Beazley (美)比兹利 经典著作全面升级   Python程序员案头必备   涵盖Python2和Python 3共有特性 内容简介 · · · · · · 本书是权威的Python语言参考指南,内容涉及核心Python语言和Python库的最重要部分。本书内容简洁扼要、可读性强,书中还包括了一些没有在Python官方文档或其他资料中出现过的一些高级的主题。 这一版在内容上进行了全面更新,介绍了Python 2.6和Python 3新引入的编程语言特性和库模块,同时还分析了Python程序员面临的如下难题:是应继续使用现有的Python代码,还是应制定计划将其移植到Python 3 作者简介 · · · · · · David M. Beazley 早在1996年就开始使用Python编程。在洛斯阿莫斯国家实验室工作期间,他教会很多志愿者用Python编写科学计算软件。他创办的Dabeaz 公司提供软件开发、培训和咨询服务,专长于Python、Ruby、Perl等动态编程语言的实际应用。他是Python软件基金会的会员。 章节介绍: 第一部分 Python语言 第1章 Python简介 第2章 词汇和语法约定 第3章 类型与对象 第4章 运算符与表达式 第5章 程序结构与控制流 第6章 函数与函数编程 第7章 类与面向对象编程 第8章 模块、包与分发 第9章 输入与输出 第10章 执行环境 第11章 测试、调试、探查与调优 第二部分 Python库 第12章 内置函数和异常 第13章 Python运行时服务 第14章 数学运算 第15章 数据结构、算法与代码简化 第16章 字符串和文本处理 第17章 Python数据库访问 第18章 文件和目录处理 第19章 操作系统服务 第20章 线程与并发性 第21章 网络编程和套接字 第22章 Internet应用程序编程 第23章 Web编程 第24章 Internet数据处理和编码 第25章 其他库模块 第三部分 扩展与嵌入 第26章 扩展与嵌入Python
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值