- 博客(9)
- 收藏
- 关注
转载 TF-IDF及其算法
文章转载自:http://www.cnblogs.com/biyeymyhjob/archive/2012/07/17/2595249.html概念 TF-IDF(term frequency–inverse document frequency)是一种用于资讯检索与资讯探勘的常用加权技术。TF-IDF是一种统计方法,用以评估一字词对于一个文件集或一个语料库中的其中一份文件的重要程度。字词...
2018-03-16 16:44:02
276
转载 HBase filter shell操作
转载自:http://www.cnblogs.com/mayidudu/p/6056772.html(1)创建表create 'test1', 'lf', 'sf'lf: column family of LONG values (binary value)-- sf: column family of STRING values (2)导入/添加数据put 'test1', 'user1|ts1...
2018-03-07 15:52:52
360
原创 Nginx访问后端应用,net::ERR_CONTENT_LENGTH_MISMATCH问题的解决
浏览器打开应用,如果需要加载大文件时,nginx会将文件保存到缓存中,此时可能会出现无法加载,报问题所显示的异常。检查思路:查看nginx中logs/error.log日志,会发现 open() "/data/PRG/nginx-1.8.0/proxy_temp/1/44/0000000441" failed (13: Permission denied) while reading upstre...
2018-03-02 14:38:42
3043
转载 avro简介
Avro是Hadoop中的一个子项目,也是Apache中一个独立的项目,Avro是一个基于二进制数据传输高性能的中间件。在Hadoop的其他项目中例如HBase(Ref)和Hive(Ref)的Client端与服务端的数据传输也采用了这个工具。Avro是一个数据序列化的系统。Avro 可以将数据结构或对象转化成便于存储或传输的格式。Avro设计之初就用来支持数据密集型应用,适合于远程或本地大规模数据的存储和交换。
2016-05-25 23:06:52
312
原创 java读取excel的内容
本例使用java来读取excel的内容并展出出结果,代码如下: import java.io.BufferedInputStream;import java.io.File;import java.io.FileInputStream;import java.io.FileNotFoundException;import java.io.IOExcept...
2013-09-09 22:24:49
109
原创 oracle正则表达式
oracle正则表达式 ORACLE中的支持正则表达式的函数主要有下面四个:1,REGEXP_LIKE :与LIKE的功能相似2,REGEXP_INSTR :与INSTR的功能相似3,REGEXP_SUBSTR :与SUBSTR的功能相似4,REGEXP_REPLACE :与REPLACE的功能相似它们在用法上与Oracle SQL 函数LIKE、INSTR、SUBSTR 和R...
2013-09-09 22:13:14
127
原创 oracle分区表
一. 分区表理论知识 Oracle提供了分区技术以支持VLDB(Very Large DataBase)。分区表通过对分区列的判断,把分区列不同的记录,放到不同的分区中。分区完全对应用透明。 Oracle的分区表可以包括多个分区,每个分区都是一个独立的段(SEGMENT),可以存放到不同的表空间中。查询时可以通过查询表来访问各个分区中的数据,也可以通过在查...
2013-09-09 14:35:25
96
原创 Oracle开窗函数
ORACLE开窗函数基本介绍:Analytic_clause的语法如下:[ query_partition_clause ] [ order_by_clause [ windowing_clause ] ]这里:query_partition_clause是查询分组子句;order_by_clause是分组排序子句;windowing_clause是窗口...
2013-09-09 14:26:49
372
原创 Oracle查询表空间使用情况
--查询表空间使用情况 SELECT UPPER(F.TABLESPACE_NAME) "表空间名", D.TOT_GROOTTE_MB "表空间大小(M)", D.TOT_GROOTTE_MB - F.TOTAL_BYTES "已使用空间(M)", TO_CHAR(ROUND((D.TOT_GROOTTE_MB - F.TOTAL_BYTES) / D.TOT_GROOT...
2013-09-09 14:23:18
332
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人