- 博客(26)
- 资源 (13)
- 收藏
- 关注
原创 windows下eclipse项目KPIUrlViewerCounter操作hadoop2.8.3 mapreduce(4)
hadoop环境搭建详情见hadoop系列第一篇与第三篇博客(hadoop配置直接影响到本程序的运行) 数据准备(https://download.youkuaiyun.com/download/elmo66/10636257):[hadoop@yourname ~]$ hadoop dfs -mkdir /UrlViewerCounter[hadoop@yourname ~]$ hadoo...
2018-08-31 11:15:24
381
原创 windows下eclipse项目wordcount操作hadoop2.8.3 mapreduce(3)
hadoop环境搭建详情见hadoop系列第一篇博客(hadoop配置直接影响到本程序的运行) 另外,windows环境下运行mapreduce程序需要hadoop.dll与winutils.exe的支持https://github.com/steveloughran/winutils本次示例为hadoop2.8.3,把对应版本的hadoop.dll与winutils.exe复制到本...
2018-08-30 09:43:37
368
原创 windows下eclipse项目java客户端远程操作hadoop2.8.3文件系统dfs(2)
hadoop环境搭建详情见上一篇博客(上一篇中的配置直接影响到本程序的运行) 值得注意的有:hadoop-eclipse插件的设置、虚拟机中主机名和IP的映射关系、hadoop5个配置文件、设置系统变量HADOOP_USER_NAME pack...
2018-08-29 19:44:03
426
原创 window环境远程连接hadoop2.8.3并运行mapreduce(1)
环境:win7 vmware myeclipse hadoop2.8.3(http://archive.apache.org/dist/hadoop/)windows下运行mapreduce所需的库文件(hdfs操作不需要)https://github.com/steveloughran/winutilsLinux环境: 仅主机模式:编辑菜单->...
2018-08-29 15:29:19
902
原创 Java的ArrayList与Python的list
JavaPython3增boolean add(E e)在尾部增加一个元素void add(int index, E e)在index处(0...n)增加一个元素boolean addAll(Collection在尾部增加一个元素集合boolean addAll(int index, Collectionappend(obj) -> None在尾
2018-01-02 21:42:06
4215
原创 Integer.bitCount(int i)求二进制数中1的个数
解法一:对于一个正整数如果是偶数,该数的二进制数的最后一位是 0 ,反之若是奇数,则该数的二进制数的最后一位是 1 。因此,可以考虑利用位移、判断奇偶来实现。Java代码 public int bitCount(int x){ int count = 0; while(x!=0){ if(x%2!=0){
2017-12-20 21:56:41
1306
原创 java解压缩文件
流:ZipInputStream ZipOutputStream包:java.util.zip压缩文件:void zip(ZipOutputStream out, File f) throws Exception { if(f.isDirectory()) { //System.out.println(f.getPath()+"--"+f.getAbsol
2017-08-31 09:51:33
395
原创 修改文件内容Java python
Java:RandomAccessFile raf = new RandomAccessFile("C:\\1.txt", "rw"); String s = raf.readLine(); long pointer =0; while(s!=null) { System.out.println(s); if(s.contains("py")) { raf.
2017-08-24 10:54:57
834
原创 字符串反转(Java python)
一般的for循环字符串反转省略Java:StringBuffer的reverse()方法Collections.reverse()方法public static void reverseStr(Char[] str) {//先把字符串转数组 List listStr = Arrays.asList(str); listStr.forEach(System.out
2017-08-22 09:37:05
595
原创 Java-Java8
1.Java语言与IDE1995-JDK1.0;2003-JDK1.5;2011-JDK7;2014-JDK8;2017-JDK9JVM-java虚拟机,.class字节码文件,“一次编译,到处运行”Java8新特性:lambda表达式:定义:f = lambda x,y:x+y 使用:f(2,3)=5接口:新增方法,方法修饰符default和static,这两个方法不是抽象的
2017-08-10 09:12:11
435
原创 windows64上python2.7连接mysql
以下是windows环境下的:0. python环境,我选择的是Anaconda2-4.3.0.1-Windows-x86_64.exe1. 安装数据库mysql,安装步骤省略,我用的版本是mysql-essential-6.0.11-alpha-winx64.msi,图形化工具为SQLyog-11.1.1-0.x64.exe2.
2017-08-08 18:34:45
929
原创 树莓派3系统安装与设置
系统安装: 硬件:树莓派3b,5V2A充电器(手机数据线),16G内存卡,HDMI转VGA线 其他:有线或无线网络,鼠标,键盘,显示器树莓派官方推荐的是使用其官方工具NOOBS安装工具。下载NOOBS(https://www.raspberrypi.org/downloads/noobs/);下载SD卡格式化工具,windows自带格式化不行。(https://ww
2017-04-18 15:18:19
4068
原创 用Python做单变量数据集的异常点分析
所谓单变量,就是指数据集中只有一个变化的值,其他变量不变,对一个变量进行异常检测,无变量相关性影响。数据文件:http://download.youkuaiyun.com/detail/elmo66/9788107分析数据的第一步是要加载文件, 本文使用了numpy,pandas,scikit learn等常见的数据分析要用到的Python库。import numpy as npimport
2017-04-10 20:04:21
1224
转载 在Python中进行基于稳健马氏距离的异常检验
原文地址:https://my.oschina.net/dfsj66011/blog/793392例如,假设你有一个关于身高和体重的数据框数据:import pandas as pdimport numpy as npfrom numpy import float64Height_cm = np.array([164, 167, 168, 169, 169, 170, 170,
2017-03-17 16:39:54
5570
1
转载 在R中进行基于稳健马氏距离的异常检验
转自http://www.cnblogs.com/cloudtj/articles/5520230.html前言 我们研究的数据中经常包含着一些不同寻常的样本,这称之为异常值(Outlier)。这些异常值会极大的影响回归或分类的效果。异常值产生的原因有很多,其中可能是人为错误、数据测量误差,或者是实际确实存在这样的异常。为了使模型能够反映大部分数据的规律,所以在数据预处理
2017-03-17 09:58:30
3695
原创 一维数组Reverse翻转与rotate旋转
数组翻转:注意变量的命名与for循环的写法。数组旋转:向右旋转k位,借助数组翻转Reverse①数组全部翻转②前k位翻转③除去前k位外,数组翻转void rotateK(int[] A,int k){ reverse(A,0,A.length-1); reverse(A, 0, k-1); reverse(A, k, A.length-1);}
2017-01-13 16:30:22
1408
原创 编译、运行与java类型转化
byte b1=3,b2=4,b;b=b1+b2;b=3+4;哪一句编译失败?为什么?-------------------------------------------------------------编译:根据值判断赋值范围运行:分配内存,变量赋值byte b1=3,b2=4,b;分析:3与4为int类型,编译过程判断范围(未超出,可以隐式转换)b
2017-01-06 21:55:59
419
原创 1.one-hot representation与distributed representation学习笔记
词表示:高维数据可以转换为连续的实数real valued概念向量,从而有效地从数据中捕获其潜在关系。例如,肺炎pneumonia和支气管炎bronchitis显然比肺炎和肥胖obesity更相关。在one-hot coding中,像这种不同代码之间的关系不能表示。one-hot coding扩展:考虑一个词表V,里面的每一个词 wi都有一个编号 i∈{1,...,|V|},那么词 w
2016-12-19 10:24:29
14929
原创 ChatterBot聊天机器人教程02—MongoDB
安装篇下载Windows 版本 Mongodb 3.4.0,官方提供x32、x64。我使用mongodb-win32-x86_64-2008plus-ssl-3.4.0-signed.msi。地址:https://www.mongodb.com/download-center#community。 运行mongodb-win32-x86_64-2008plus-ssl-3.4.0
2016-12-16 15:56:47
6606
原创 ChatterBot聊天机器人教程01
创建第一个BOT聊天创建一个名为chatbot.py新文件。然后打开chatbot.py,导入包和实例化一个ChatBot。from chatterbot import ChatBot bot = ChatBot('Norman')存储适配器聊天机器人有自带的适配器类,允许它连接到不同类型的数据库。在本教程中,我们将使用JsonFileStorageAdapter,
2016-12-06 15:34:56
10466
1
原创 Python3.5安装与ChatterBot聊天机器人使用
ChatterBot是一个基于机器学习的聊天机器人引擎,构建在python上,主要特点是可以自可以从已有的对话中进行学习。开源地址:https://github.com/gunthercox/ChatterBot安装点击阅读文档链接,跳转到http://chatterbot.readthedocs.io/en/stable/setup.html 点击左边导航地址:Ch
2016-12-05 20:39:17
11891
1
转载 问答系统(QA)1—基于词典的正向最大匹配算法
转载:杨尚川地址:http://yangshangchuan.iteye.com/blog/2031813内容有修改基于词典的正向最大匹配算法(最长词优先匹配),算法会根据词典文件自动调整最大长度,分词的好坏完全取决于词典。算法流程图如下: Java实现代码如下:package nlp.segmentation;import java.io.IOException
2016-12-01 11:06:03
4460
原创 问答系统(QA)0
现有的检索系统,无论是受限领域的检索还是互联网搜索引擎,一般都是基于关键字检索(1.相关答案多2.意图表达差3.语言层,未触及语义层)。Frequently Asked Questions,FAQ,即通过提取问题特征进行相似度计算来返回排序后的答案,问题解析:主要包括分词、词性标注、句法分析、命名实体识别、问题分类、问题扩展等。分词:中英文分词存在很大的区别,英文单词之间是以空格作
2016-11-23 12:09:22
14891
1
原创 hadoop源码分析-WritableComparator
类:public class WritableComparator implements RawComparator 方法一: public static int compareBytes(byte[] b1, int s1, int l1, byte[] b2, int s2, int l2) { int e
2016-10-12 19:45:38
605
转载 jsp中radio的性别信息的数据回显
第一种方式:if test="${info.sex=='1'}">"radio" name="emp.sex" checked="checked" value="1"/>男"radio" name="emp.sex" value="0"/>女if>if test="${info.sex=='0'}">"radio" name="emp.sex" value="1
2016-04-09 21:32:58
8520
hadoop-eclipse插件(hadoop-eclipse-plugin-2.8.3.jar)与winutils
2018-08-29
Java自然语言处理(影印版 英文版)代码
2016-11-28
SpringMVC+Spring+MongoDB实现后台管理系统
2016-08-20
高仿QQ的即时通讯
2016-08-18
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人