- 博客(140)
- 资源 (7)
- 收藏
- 关注
原创 hive表信息查询:查看表结构、表操作、建表语句
问题导读:1.如何查看hive表结构?2.如何查看表结构信息?3.如何查看分区信息?4.哪个命令可以模糊搜索表28.怎么查询创建表语句1.hive模糊搜索表 show tables like '*name*';2.查看表结构信息 desc formatted table_name; desc table_name;3.查看分
2017-07-24 18:38:42
12570
转载 linux zip/unzip
转自 : http://www.cnblogs.com/lucyjiayou/archive/2011/12/25/2301046.html功能说明:压缩文件。语 法:zip [-AcdDfFghjJKlLmoqrSTuvVwXyz$][-b ][-ll][-n ][-t ][-][压 缩文件][文件...][-i ][-x ]补充说明:zip是个使用广泛的压缩程序,文件
2017-07-24 18:31:20
437
原创 hadoop配置相关前置修改
1.修改主机名称[root@centos ~]# vim /etc/sysconfig/network打开文件,修改以下内容并保存 NETWORKING=yes #使用网络 HOSTNAME=centos #设置主机名称重启后生效然后去修改 /etc/sysconfig/network-script/ifcfg-e
2015-07-15 20:57:01
617
原创 java 对象的创建
1,虚拟机遇到一条new指令首先将去检查这个指令的参数是否能在常量池中定义到一个类的符号引用。2,并且检查这个符号引用代表的类是否被加载、解析和初始化过。如果没有,那必须先执行相应的类加载过程。3, 类加载检查通过后,虚拟机为新生对象分配内存。在Java堆中划分一块等同类大小的内存。 划分方法:碰撞指针或空闲列表法。4,如果解决多线程情况下的对象创建问题。(TLAB,T
2015-03-17 11:32:08
479
转载 eclipse导入工程后无法加入tomcat
到工程的文件夹(工作空间里),如Work Space\test\.settings\org.eclipse.wst.common.project.facet.core.xml打开这个文件,XML/HTML code?123456789xml version="1.0" encoding="UTF-8"?>fac
2014-10-19 23:15:33
6191
转载 log4j配置
log4j是一个非常强大的log记录软件,下面我们就来看看在项目中如何使log4j。 首先当然是得到log4j的jar档,推荐使用1.2.X版,下载地址:http://logging.apache.org/log4j/1.2/download.html 我们先看一个最简单的示例:【示例1】项目结构:【注:由于这里的多个项目公用一个jar档,我们可以创建一个专
2014-10-09 15:15:06
552
原创 spring3 定时器 时间配置
cronExpression表达式:字段 允许值 允许的特殊字符秒 0-59 , - * /分 0-59 , - * /小时 0-23 , - * /日期 1-31 , - * ? / L W C月份 1-12 或者 JAN-DEC , - * /星期 1-7 或者 SUN-SAT , - * ? / L C #年(可选) 留空, 1970-2099 , - * /
2014-07-31 18:56:03
735
原创 潜在语义分析Latent semantic analysis note(LSA)原理及代码实现
Latent Semantic Analysis (LSA)也被叫做Latent Semantic Indexing(LSI),从字面上的意思理解就是通过分析文档去发现这些文档中潜在的意思和概念。假设每个词仅表示一个概念,并且每个概念仅仅被一个词所描述,LSA将非常简单(从词到概念存在一个简单的映射关系)不幸的是,这个问题并没有如此简单,因为存在不同的词表示同一个意思(同义词),一个词表示多个
2014-06-13 16:40:24
17290
4
原创 java 使用htmlunit模拟登录爬取新浪微博页面
import java.io.IOException;import java.net.MalformedURLException;import com.gargoylesoftware.htmlunit.BrowserVersion;import com.gargoylesoftware.htmlunit.FailingHttpStatusCodeException;import
2014-06-09 16:34:24
16833
1
转载 张瑞敏:人不成熟的六大特征
人不成熟的六大特征:立即要回报;不自律;经常被情绪左右;不愿学习,自以为是,没有归零心态;做事情靠直觉,不以事实为根据;做事情不靠信念,靠人言。只要你相信你自己能够战胜自己的不成熟,你就会逐渐的成长、成熟起来,你就会得到你想要的那种生活,你就会实现你时间自由、财务自由、精神自由的人生梦想! 人成熟与不成熟跟年龄没有关系,人成熟不成熟,就是你能不能站在对方的角度去看待事物,就是能不能
2014-06-06 16:27:43
1658
转载 Java 解决采集UTF-8网页空格变成问号乱码
昨天发现,用 HtmlDecode() 去解码后,“ ”不是被解码为半角的空格(ASCII码0x20)而是变成半角问号“?”(ASCII码0x3F)。而且奇怪的是,只有每行前面的空格才会出问题,如果前面后面有汉字的话,空格就还是空格。但是更加奇怪的是,如果直接在HtmlDecode()的后面直接加上trim()的话,这个问号会被去掉。而正常的情况下,问号是不会被去掉的,只有空格才会被去掉
2014-05-26 17:43:54
14093
转载 svm 入门
发表于 2009-11-5 11:06:29|只看作者Arguments 前面提到,在 train 的时候可以下一些参数。 ( 直接执行 svm-train 不指定输入档与参数会列出所有参数及语法说明 ) 这些参数对应到原始 SVM 公式的一些参数,所以会影响 predict 的正确与否。举例来说,改个 c=10: ./svm-train -c 10 heart_sca
2014-04-20 20:38:05
753
原创 爬虫相关网站
开源爬虫调研http://blog.sina.com.cn/s/blog_6d0b92d90100w6p7.html正文抽取算法http://wenku.baidu.com/link?url=U07Qfde4TZE52Oa1aQF71GI_vyauyfRmgakWHp2CcQM1n8EyBpZnnU6sm4qcqiIOi_cApIwSxIVieMDRTskSjYmyAJSBUB
2014-03-25 17:24:07
579
原创 推荐系统
推荐系统评测指标1、用户满意度2、预测准确度评分指标TopN推荐覆盖率(准确率、召回率曲线)覆盖率衡量函数(信息熵,基尼系数)多样性新颖性 (用户是否听说过这个结果)惊喜度(如果推荐结果和用户的历史兴趣不相似,但却让用户觉得满意,那么就可以说推荐结果的惊喜度高)信任度实时性健壮性(尽量使用代价比较高的用户行为)离线优化指标
2014-03-23 17:02:25
837
原创 js 调用天气预报webservice
控制台运行结果: 黑龙江,3113 吉林,3114 辽宁,3115 内蒙古,3116 河北,3117 河南,3118 山东,3119 山西,31110 江苏,31111 安徽,31112 陕西,31113 宁夏,31114 甘肃,31115 青海,31116 湖北,31117 湖南,31118
2014-03-20 22:44:29
4196
2
原创 spring 事物学习
事物:以可控的方式对数据资源访问的一组操作。四个属性:原子性一致性隔离性持久性事物的家族成员:Resource Manager RMTransaction Processing Moniter :管理多个RM之间的协调Transaction MoniterApplication全局事物:整个事物处理过程中有多个RM参与。
2014-03-02 23:22:59
566
转载 solr date时间差8小时解决办法
solr因为时区设置问题,导致正常入索引后的date类型的时间会减少8小时,跟多初学者会为此苦恼,今天我把个人解决的方案给大家说一下,希望能帮助到大家. 方案一:对date类型的时间字段,如果可以的话,可以将solr的时间field的类型改为string类型,这样也就不存在时差的问题了,这个方案是可行的. 方案二:既然知道solr入索引时,时间类型的字段会减少8小时,那么我
2014-02-24 13:29:49
6118
转载 svn 服务器搭建
搭建svn服务的方法步骤问题,主要有七个部分 。下面是具体的步骤介绍。一、准备工作1、获取S version服务器程序到官方网站(http://s version.tigris.org/)下载最新的服务器安装程序。目前最新的是1.5版本,具体下载地址 在:http://s version.tigris.org/servlets /ProjectDoc
2014-02-17 14:36:23
599
转载 myeclipse svn插件安装
方法一:在线安装 1.打开HELP->MyEclipse Configuration Center。切换到SoftWare标签页。 2.点击Add Site 打开对话框,在对话框Name输入Svn,URL中输入:http://subclipse.tigris.org/update_1.6.x3.在左边栏中找到Personal Site中找到SVN展开。将Core
2014-02-17 10:41:48
654
转载 windows server 2008做NTP时间服务器
windows server 2008做NTP服务器与H3C网络设备组网首先WINDOWS SERVER 2008默认是关闭NTP服务的,需要通过修改注册表开启方法如下:------------------------------------------------------------------------服务端: 默认情况下,独立服务器WINDOWS SERVER
2014-02-12 11:50:30
39291
转载 Myeclipse的java工程转web工程
修改工程目录下的.project文件普通工程下的该文件内容是:UTF-8"?> xxx org.eclipse.jdt.core.javabuilder org.eclipse.jdt.core.javanature 替换成下面UTF-8"?> Pro com.genuitec.ecli
2014-02-11 11:49:05
712
原创 LingoClusteringAlgorithm 算法
LingoClusteringAlgorithm 继承 ProcessingComponentBase 实现 IProcessingComponentProcessingComponentBase的生命周期有方法: public void init(IControllerContext context) { } public void b
2013-12-30 13:36:09
710
转载 Apache Commons工具集简介
(转)Apache Commons工具集简介Apache Commons包含了很多开源的工具,用于解决平时编程经常会遇到的问题,减少重复劳动。我选了一些比较常用的项目做简单介绍。文中用了很多网上现成的东西,我只是做了一个汇总整理。一、Commons BeanUtilshttp://jakarta.apache.org/commons/beanutils/index.html说明:针
2013-12-25 16:09:36
571
原创 solr自动补全
http://192.168.10.50:8082/solr/terms?terms.fl=itemdesc&terms.sort=itemdesc&terms.prefix=中国请使用非谷歌浏览器打开,使用谷歌浏览器打开会有转义问题参考http://wiki.apache.org/solr/TermsComponent
2013-12-17 17:18:14
813
转载 solr 层面搜索
转自http://macrochen.iteye.com/blog/1337576solr将以导航为目的的查询结果称为facet. 它并不会修改查询结果信息, 只是在查询结果上根据分类添加了count信息, 然后用户根据count信息做进一步的查询, 比如淘宝的查询列表中, 上面会表示不同的类目相关查询结果的数量.比如搜索数码相机, 在搜索结果栏会根据厂商, 分辨率等维度列出, 这
2013-12-17 17:16:15
2021
原创 第一天、开始编译vlc
准备做一个收录程序,并且是可以转码的程序。目标还还宏大啊!好吧,天才第一步,雀氏纸尿裤。照着下面demo做没有做成功,我真是适合去做测试啊,各种好程序到我手里必须经过好多关才能正常运行。我先安装一个vlc,先从一点小成功做起,呵呵!安装一个总不能出错吧,呵呵!1. 到 http://www.videolan.org/vlc/download-sources.html 下载最新的
2013-09-02 23:58:46
640
原创 VC++的工程文件说明
dsw, aps, clw, plg这些文件都可以删除。只保留 H,C,CPP,DSP,RC,剩余文件去除只读属性,其余全部删除。然后打开DSP 有提示选 YES,就可以了。 *.dsp(DeveloperStudio Project):是VC++的工程配置文件,比如说你的工程包含哪个文件,你的编译选项是什么等等,编译的时候是按照.dsp的配置来的。 *.dsw(Develop
2013-08-26 15:43:09
703
转载 查看sqlserver被锁的表以及如何解锁
查看sqlserver被锁的表以及如何解锁 查看被锁表: www.2cto.com select request_session_id spid,OBJECT_NAME(resource_associated_entity_id) tableName from sys.dm_tran_locks where resource_type='OBJECT'
2013-08-06 23:04:51
448
原创 xml 选取指定节点
使用dom4j读取xml'时,当需要根据路径读取时,需要使用jaxen-1.1-beta-6.jar, File f = new File("B://workplace//InterfaceSystem//src//com//tmzs//xml//编目信息.xml"); FileReader fr = new FileReader(f);
2013-07-10 21:01:29
1217
原创 Axis 1.4 使用指南
根据wsdl开成webservice的java客户 例子:1、执行以下命令生成客户端代码Java -Djava.ext.dirs=lib org.apache.axis.wsdl.WSDL2Java http://localhost:8080/axis/Hello.jws?wsdl 该命令的参数格式从最简单的开始 ,-uri 指定wsdl文件> WSDL2Java -ur
2013-07-06 21:14:38
2163
原创 朴素贝叶斯算法
贝叶斯定理由英国数学家贝叶斯 ( Thomas Bayes 1702-1763 ) 发展,用来描述两个条件概率之间的关系,比如 P(A|B) 和 P(B|A)。按照乘法法则:P(A∩B)=P(A)*P(B|A)=P(B)*P(A|B),可以立刻导出贝叶斯定理公式:P(A|B)=P(B|A)*P(A)/P(B)如上公式也可变形为:P(B|A)=P(A|B)*P(B)/P(A)
2013-06-06 23:30:36
708
转载 Heritrix配置
转自http://yourlei.blog.sohu.com/111046417.html自己上班搞了2年多的蜘蛛和采集,只是一直是使用自己的程序,今天抽时间想看看其他蜘蛛的情况,于是下载了heritrix-1.14.2。搜索了一下相关的安装介绍。基本步骤如下: (1)解压下载的heritrix-1.14.2.zip的压缩包,如将其放在E:\datasource\heritrix
2013-05-27 00:20:32
620
转载 JNDI全攻略(一)
关键字:JNDI,J2EE,Java,命名和目录接口,Java Naming and Directory Interface摘要:本文详细介绍了JNDI的架构与实现,JNDI的工作原理,并给出了具体代码,帮助读者更理解J2EE主要常用技术---JNDI.本文为系列文章的第一篇,其它相关文章会在近期推出。 名词解释 jndi是Java 命名和目录接口(J
2013-04-11 20:54:10
553
原创 RPC 远程过程调用
为一个进程访问其他进程服务的能力。这些进程往往处于不同的计算机。RPC是一种客户机/服务器形式的服务,一个客户机进程可以执行另一台计算机上的进程,向这个进程提供数据,获取这个进程运行的结果。
2013-04-11 15:56:10
546
转载 eclipse生成jar包
http://www.cnblogs.com/lan0725/archive/2008/08/28/1873947.html第一:普通类导出jar包,我说的普通类就是指此类包含main方法,并且没有用到别的jar包。 1.在eclipse中选择你要导出的类或者package,右击,选择Export子选项; 2.在弹出的对话框中,选择java文件---选择JAR file,单
2013-04-03 15:28:32
484
原创 Ubuntu linux安装ssh server
sudo apt-get install openssh-server如果报 “Couldn't find package”sudo gedit /etc/apt/sources.list添加: www.2cto.com 修改了sources.list要sudo apt-get upgrade一下.自动启动 ( 好像安装后默认地已经以openssh-daem
2013-03-29 22:23:05
728
Natural.Language.Processing.with.Python
2012-03-10
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人