
Java
文章平均质量分 95
吕秀才
静下心来,每一步都踏踏实实。
展开
-
input2byte
public static final byte[] input2byte(InputStream inStream) throws IOException { ByteArrayOutputStream swapStream = new ByteArrayOutputStream(); byte[] buff = new byte[100]; int rc = 0; whi原创 2013-06-13 18:58:44 · 970 阅读 · 0 评论 -
切分句子(非正则)
/** * @function * @param source 待分句的句子 * @param div 分隔符 * @param include 结果中是否包含分隔符 * @return */ public static String[] split(String source, String div, boolean include) { StringTokeni原创 2014-06-24 16:33:16 · 1326 阅读 · 0 评论 -
遍历文件 ,获取文件名
/** * @function 遍历文件(包含子文件夹),返回其中的文件名(路径) * @param strPath * @return */ public static ArrayList getFilePath(String strPath , String contains) { ArrayList filelist = new ArrayList();原创 2014-01-22 13:36:27 · 2165 阅读 · 0 评论 -
本地读取HDFS文件
static public ArrayList getContentFromHDFS(String filePath) { BufferedReader in = null; ArrayList lstResult = new ArrayList(); try { Configuration conf = new Configuration(); FileSystem f原创 2014-01-24 09:39:09 · 2063 阅读 · 0 评论 -
切分句子(非正则)
/** * @function * @param source 待分句的句子 * @param div 分隔符 * @param include 结果中是否包含分隔符 * @return */ public static String[] split(String source, String div, boolean include) { StringTokeni原创 2014-01-23 11:13:47 · 893 阅读 · 0 评论 -
遍历hadoop文件夹
/** * 得到一个目录(不包括子目录)下的所有名字匹配上pattern的文件名 * @param fs * @param folderPath * @param pattern 用于匹配文件名的正则 * @return * @throws IOException */ public static List getFilesUnderFolder(FileSystem原创 2013-06-08 08:56:30 · 5136 阅读 · 4 评论 -
序列化上传到集群运行
package com.iminer.alg.review.movie.xinjian;import java.io.ByteArrayOutputStream;import java.io.FileInputStream;import java.io.FileOutputStream;import java.io.IOException;import java.io.InputSt原创 2013-06-14 09:44:03 · 835 阅读 · 0 评论 -
TraClus轨迹聚类算法原理及java版实现
前一阵子我们部门接到了业务那边的一个需求。想通过用户的wifi数据计算出商场内用户最喜爱走的线路。其实说白了就是用户轨迹聚类。根据业务的需求,我们最终采用了traClus聚类算法。traClus算法相比于其它的轨迹聚类算法的一大不同点是,该算法先把一个用户的轨迹分成了若干线段,然后把基于所有用户的轨迹生成的线段放到一个集合中进行聚类。算法本身可以划分为三个部分,分别为:1、用户轨迹分段。...原创 2019-09-19 16:37:07 · 8541 阅读 · 42 评论