- 博客(26)
- 资源 (8)
- 收藏
- 关注
原创 学习笔记———《自动文档摘要评价方法---Edmundson和ROUGE》
本人最近在做一个自动文档摘要相关的项目,研究了一下目前业界的一些评价方法,阅读了Chin-Yew Lin的《ROUGE: A Package for Automatic Evaluation of Summaries》的paper,也对应看了其他朋友整理的笔记,特整理此笔记供大家参考!自动文档摘要评价方法大致分为两类:(1)内部评价方法(Intrinsic Methods)在提供参
2017-04-09 21:55:50
19132
3
原创 zookeeper学习笔记———《zookeeper-3.4.6单机伪集群配置》
1.配置先下载zookeeper-3.4.6.tar.gz到本机 下载地址:进去http://apache.fayea.com/zookeeper/zookeeper-3.4.6/界面,点击zookeeper-3.4.6.tar.gz即可下载。可以选择需要的版本,我下载的是zookeeper-3.4.3.tar.gz,解压得到文件夹zookeeper-3.4.3由于手头
2016-01-16 22:46:35
1050
原创 Hadoop学习笔记———《读、写HDFS文件》
读取HDFS上的文件 /** * Created by MJ on 15/12/06. * * @use 读取HDFS上的指定文件的内容并返回 * * @param filePath 待写入的HDFS文件路径 * @return String 文件的内容 * @exception Exception 异常返回null
2015-12-24 11:12:03
971
原创 Hadoop学习笔记———《MultipleOutputs———将结果输出到指定的多个文件或文件夹》
在MapReduce中使用MultipleOutputs将结果输出到多个文件或文件夹使用步骤主要有三步:1、在reduce或map类中创建MultipleOutputs对象,将结果输出;class TestReducer extends Reducer{ //将结果输出到多个文件或多个文件夹 private MultipleOutputs mo
2015-10-12 17:33:58
2455
原创 Java学习笔记———《单例模式的7种实现详解》
最近学习了一下单例模式,整理如下,如有错误和不足之处欢迎各位批评纠正,互相学习!第一种:懒汉式,线程不安全package singleton;/** * Created by MJ on 15/10/7. * * @use 懒汉,线程不安全, 在单进程的时候工作正常,但在多线程的情况下就不能正常工作。 */public class Singleton1 {
2015-10-07 23:38:27
488
原创 Java学习笔记———《http的get请求和post请求及封装的工具类》
最近学习了一下http的get请求和post请求的写法,整理如下,并封装了工具类,如有错误和不足之处欢迎各位批评纠正,互相学习!package mj.http.utils;/** * Created by MJ on 15/9/25. * * @use 该HttpParam类用于封装HTTP请求参数 */public class HttpParam { privat
2015-10-07 17:22:12
3491
原创 HBase学习笔记(四)———《客户端API》
HBase的主要客户端接口是由org.apache.hadoop.hbase.client包中的HTable类提供的,通过这个类,用户可以完成HBase存储和检索数据,以及删除无效数据之类的操作。所有修改数据的操作都保证了行级别的原子性,这会影响到这一行数据所有的并发读写操作。用户应当尽量使用批量处理(batch)更新来减少单独操作同一行数据的次数。创建HTable示例是有代价的。每个实例都需要扫
2015-09-14 23:29:15
612
原创 HBase学习笔记(三)———《HBase简单shell操作命令》
HBase简单shell操作命令1、Hbase Shell 练习$ /bin/hbase shell HBase Shell; enter 'help' for list of supported commands.Type "exit" to leave the HBase ShellVersion 0.94.27, rfb434617716493eac82b55180
2015-09-07 17:18:15
903
原创 HBase学习笔记(一)———《HBase简介》
HBase简介1、HBase表的结构HBase以表(table)的形式存储数据Row Key 行键 与NoSQL数据库们一样,row key是用来检索记录的主键。row key行键 (row key)可以是任意字符串(最大长度是 64KB,实际应用中长度一般为 10-100bytes),在HBase内部,row key保存为字节数组。存储时,数据按照row key的字典序
2015-09-07 16:32:16
711
原创 Java学习笔记———《使float保留两位小数或多位小数》
float都保存的是2进制近似值,所以不存在保留十进制几位小数的情况。所谓保留几位小数,都是用于十进制显示时的显示格式。方法1: float a = 123.2334f; float b = (float)(Math.round(a*100))/100; // 这里的100就是2位小数点,如果要其它位,如4,这里两个100改成10000方法2
2015-04-29 11:50:16
658
原创 Maven学习笔记———《Mac 上maven安装、配置及常用命令》
Maven是一个采用纯Java编写的开 源项目管理工具。Maven采用了一种被称之为project object model (POM)概念来管理项目,所有的项目配置信息都被定义在一个叫做pom.xml的文件中,通过该文件,Maven可以管理项目的整个声明周期,包括编译,构建,测试,发布,报告等等。目前Apache下绝大多数项目都已经采用Maven进行管理。而Maven本身还支持多种插件,可以方便
2015-04-20 20:51:49
983
原创 HBase学习笔记———《Zookeeper 单机模式安装和配置》
单机模式http://zookeeper.apache.org/releases.html下载zookeeper的安装包之后, 解压到合适目录. 进入zookeeper目录下的conf子目录vi zoo.cfg 创建zoo.cfg,并增加一下内容:tickTime=2000dataDir=/Users/lichengjin/zookeeper-3.4.6/datad
2015-04-15 15:44:02
2101
原创 Hadoop学习笔记———《HDFS基础命令》
1、查看目录(列表)信息$ bin/hadoop dfs -ls /dirname/2、创建dirname目录$ bin/hadoop dfs -mkdir dirname3、删除dirname目录$ bin/hadoop dfs -rmr dirname4、上传filename文件到HDFS的dirname目录$ bin/hadoop dfs -put filenam
2015-04-15 11:53:59
573
原创 Hadoop学习笔记———《Mac OS X 下hadoop2.6.0安装教程》
官网2.6.0的安装教程:http://hadoop.apache.org/docs/r2.6.0/hadoop-project-dist/hadoop-common/SingleCluster.htmlhdfs指令:http://hadoop.apache.org/docs/r2.6.0/hadoop-project-dist/hadoop-common/FileSystemShell.ht
2015-04-14 20:45:50
2787
原创 HBase学习笔记(二)———《安装教程》
hbase安装1、下载解压最新版本从http://www.apache.org/dyn/closer.cgi/hbase/上下载最新的HBase版本,后缀为 .tar.gz 的文件; 例如 hbase-0.94.27.tar.gz.,并将内容解压到合适的目录,如user/local即可,就像这样;$ cd /usr/local$ tar -zxvf hbase-x.y.z
2015-04-13 23:38:51
561
原创 Python学习笔记———《列表操作》
列表排序sort()函数使用固定的排序算法对列表排序。sort()函数对列表排序时改变了原来的列表,从而让其中的元素能按一定的顺序排列,而不是简单的返回一个已排序的列表副本。注意sort()函数改变原来的列表,函数返回值是空值即None。因此,如果需要一个已排好序的列表副本,同时又要保留原有列表不变的时候,就不能直接简单的使用sort()函数。为了实现上述功能使用sort()的方法是:
2015-04-10 12:57:11
498
原创 linux学习笔记———《常用命令》
实现从服务器A机192.168.18.137 SSH直接登入到B机192.168.18.120上1、A主机生成公、私钥证书:【root@A ~】#ssh-keygen -t rsa #生成公、秘钥证书,一直回车【root@A .ssh】# cd ~/.ssh #进入.ssh2、将公钥id_rsa.pub传到B机上【root@B~】 mkdir .s
2015-04-08 23:27:04
426
原创 MySQL学习笔记———《数据库操作》
显示数据库show databases;创建名为test_db的数据库create databasetest_db;删除名为test_db的数据库drop databasetest_db;使用名为test_db数据库usetest_db;导入~/test/路径下得大的filename.sql文件source
2015-04-08 23:12:39
426
原创 Python学习笔记———《字符串操作》
小写转大写low_strs = 'abcd'low_strs = low_strs.upper()print('abcd小写转大写:', low_strs)大写转小写uper_strs = 'DEFG'uper_strs = uper_strs.lower()print('DEFG大写转小写:', uper_strs)只大写第一个字母test_strA = 'g
2015-04-08 23:05:36
472
原创 Python学习笔记———《字典操作》
按顺序遍历字典for key, value in dict.items(): print(key, value)
2015-04-08 22:43:36
416
原创 Python学习笔记———《计算程序运行时间》
计算程序运行时间import time# The start timestart = time.clock()# 程序代码# The End timeend = time.clock()print 'used_time: ', (end - start)
2015-04-08 10:08:28
425
原创 Python学习笔记———《文件操作》
判断文件是否存在import osfilename = '~/lcj/test.txt'if os.path.exists(filename): message = 'OK, the "%s" file exists.'else: message = "Sorry, I cannot find the "%s" file."print message % filen
2015-04-08 09:55:35
393
原创 学习笔记———《SIFT算法》
本人在看论文的过程中涉及到了SIFT算法,通过阅读Lowe的文章,也对应看了别人整理的笔记,个人觉得有些地方说的不是很清楚,特整理此笔记供大家参考!想下载pdf版本的朋友请到我资源里去下载,下载地址:http://download.youkuaiyun.com/detail/lcj369387335/6846387SIFT(Scale-InvariantFeature Transform)SIFT
2014-01-14 16:09:38
6266
1
原创 学习笔记———《GMM模型以及基于EM算法的参数估计》
本人在看论文的过程中涉及到了GMM模型,所以查找相关文献整理了一下,共享给大家!基于EM算法的参数估计是通过斯坦福大学的公开课讲EM算法的视频学习的,也对应看了别人整理的笔记,个人觉得有些地方说的不是很清楚,特整理此笔记供大家参考。
2013-12-18 19:46:27
2136
原创 学习笔记———《EM算法》
PS:本人在学习EM算法时,是通过斯坦福大学的公开课讲EM算法的视频学习的,也对应看了别人整理的笔记http://www.cnblogs.com/jerrylead/archive/2011/04/06/2006936.html,个人觉得有些地方说的不是很清楚,特整理此笔记供大家参考。
2013-12-18 10:24:18
777
原创 学习笔记———《最大类间方差法》
最大类间方差法是由日本学者大津(N.Otsu)于1979年提出的,又叫大津法,简称Otsu法,是一种自适应的阈值确定的方法。它的基本思想是以某一灰度值(如t)为阈值,将图像中的像素分成两类C0和C1,然后计算它们的方差,方差越大,说明目标和背景之间的差异越大,阈值的选取就越合理。
2013-12-17 21:58:50
1175
GMM模型以及基于EM算法的参数估计
2013-12-18
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人