
通用基础知识或工具
文章平均质量分 68
OnlyQi
我是一只蜗牛
展开
-
Elasticsearch 简介
Elasticsearch现在在数据处理领域得到了广泛使用。在Elasticsearch中,数据的逻辑单元称为index(类似数据库中的表),而其中的数据成为document(类似数据库中的一行数据)。当我们把数据load到Elasticsearch时,例如load一个JSON文件,该文件中的数据会被load到一个index中,且一行JSON数据成为一个document。而每个value需要被自动映射到datatype上,这个过程是Elasticsearch自动完成的,称为dynamic mappin.原创 2021-01-14 15:14:32 · 1001 阅读 · 0 评论 -
聊一聊float和double数字类型
一,什么是浮点?“浮点”是相对“定点”而言的,表示存储时小数点的位置是不固定的,浮动的。为什么要使用浮点数呢?答案是为了节约存储空间。例如:如果一个变量可能会被用来存储这两个数:10000.0和0.00001。如果用定点数,那么这个变量至少可以保存:10000.0000000000.00001可见用定点数,必须一个0都不能少,原原本本地保存下来。而使用浮点数,就可以保存:小数:1 指数:10的4次方小数:1 指数:10的-4次方只需要保存小数部分和小数点的位置就可以了。这样就大大节省了存储原创 2020-10-09 14:56:53 · 1580 阅读 · 0 评论 -
大数据系统常用文件存储格式File format
常见的文件存储格式有行式存储,列式存储和混合式存储。在大数据系统中,列式存储和混合式存储更常见。对于HDFS这样的文件存储系统来说,其实并不关心存储的是什么形式的存储文件。只是在解析数据时,需要知道是什么类型的文件。例如Hive对RCFile和ORCFile的支持就在于,Hive知道这两种文件中数据的存储方式,并正确地解析数据并查询。1,行式存储广泛使用于主流关系型数据库及HDFS中。优势...原创 2019-08-15 10:24:28 · 3029 阅读 · 0 评论 -
URI, URL and URN
URIs identify and URLs locate; however, locations are also identifications, so every URL is also a URI, but there are URIs which are not URLs.Examples: Roger PateThis is my name, which转载 2013-01-31 11:38:28 · 898 阅读 · 0 评论 -
用7z压缩目录下的所有文件(保留源文件名,后缀改为7z)
#!/bin/kshfor f in $(ls /data/output/test/*.xml)do 7za a -t7z $f.7z $f done原创 2013-02-01 15:37:38 · 5483 阅读 · 0 评论 -
JAMS Scheduler
The JAMS Scheduler uses a master/agent configuration and automates application processes on a variety of operating systems and architectures.简单的说,JAMS就是一个master/slave的架构,而master node(只能是windows)可以控制转载 2013-04-18 10:43:55 · 1105 阅读 · 0 评论 -
使用opsview来监控管理网络
http://www.opsview.com/Opsview Core is a free open source network monitoring software application. It solves the challenges of monitoring modern IT and network systems.例如可以使用opsview来管理如下事件等等。转载 2013-05-29 15:41:55 · 1671 阅读 · 0 评论 -
VMware ESXi and vSphere client
VMware ESXi is based on hypervisor architecture that runs directly on top of a hardware as shown below.you can manage the ESXi server using vSphere client. vSphere client works only on Windows h转载 2013-10-24 13:40:41 · 1544 阅读 · 0 评论 -
CNAME
http://en.wikipedia.org/wiki/CNAME_record查询cname也很简单:nslookup -q=cname mail.spottedfig.org转载 2014-03-24 13:28:17 · 1095 阅读 · 0 评论 -
What's the difference between a URI and a URL?
URI s identify and URL s locate; however, locators are also identifiers, so every URL is also a URI, but there are URIs which are not URLs.ExamplesRoger PateThis is my name, which is转载 2014-08-25 11:22:21 · 932 阅读 · 0 评论 -
记录一下有用的链接和tool,会一直添加的~
非常好的web基础知识教程:http://www.w3school.com.cn/h.aspIntroduction to State Machines:http://www.desaware.com/tech/statemachineintro.aspxPath Tools Eclipse Plug-in:http://code.google.com/p/pathtools/原创 2011-04-23 09:45:00 · 1124 阅读 · 0 评论 -
什么是Flat File
"Flat"which means it has no structure for indexing and there are usually no structural relationships between the records. 一个flat file即可以是纯文本文件(plain text file),也可以是二进制文件(binary file)。纯文本文件pl原创 2016-03-15 18:50:15 · 6583 阅读 · 0 评论 -
全文搜索 full-text search
设想这样一个需求:创建一个网站,网站上可以发表文章,并且可以搜索内容中包含关键字的文章。我们可以选择把文章存在硬盘上,或是存在数据库里。而搜索功能则可以依赖全文搜索,或是让google等搜索引擎爬自己的网页,然后用google实现站内搜索。如果不想依赖google等搜索引擎,则需要使用全文搜索技术。 首先是关于全文索引的wikipedia:http://en.wikipedia.org转载 2013-03-04 16:31:30 · 1868 阅读 · 0 评论 -
数据库中的常用Key术语
KeyA key is one or more data attributes that uniquely identify an entity. In a physical database a key would be formed of one or more table columns whose value(s) uniquely identifies a row within a转载 2016-04-08 14:27:10 · 6078 阅读 · 0 评论 -
Excel中的$是什么意思
相对引用、绝对引用和混合引用是指在公式中使用单元格或单元格区域的地址时,当将公式向旁边复制时,地址是如何变化的。具体情况举例说明:1、相对引用,复制公式时地址跟着发生变化,如C1单元格有公式:=A1+B1当将公式复制到C2单元格时变为:=A2+B2当将公式复制到D1单元格时变为:=B1+C12、绝对引用,复制公式时地址不会跟着发生变化,如C1单元格有公式:=$A$1+$原创 2016-05-27 15:32:25 · 6591 阅读 · 0 评论 -
R与Excel的集成
http://www.thertrader.com/2014/02/11/a-million-ways-to-connect-r-and-excel/转载 2017-06-13 09:54:34 · 1675 阅读 · 0 评论 -
MD5
理解MD5MD5的应用非常广泛。例如我们在unix中下载某种软件时,常常会看到一个扩展名为.md5的文件,内容大概是:MD5 (tanajiya.tar.gz) = 0ca175b9c0f726a831d895e269332461这就是tanajiya.tar.gz文件的数字签名。因此当我们得到这个文件后,使用工具计算该文件对应的md5值,然后和文件中记录的.md5中记原创 2013-01-15 17:57:13 · 1469 阅读 · 0 评论 -
随机数
随机数的定义This sequence is random if the quantity of information it contains – in the sense of Shannon's information theory – is also infinite.In other words, it must not be possible for a computer prog原创 2013-01-15 16:20:03 · 1242 阅读 · 0 评论 -
如何在unix上搭建FTP Server
非常简单的step by step to build a FTP server:原文链接:http://en.wikibooks.org/wiki/Solaris/Solaris_FTP_Server_Setup首先需要确定机器上是否已经安装了FTPbash-3.00# svcs | grep ftponline Nov_29 svc:/ne原创 2011-11-29 16:42:03 · 4111 阅读 · 0 评论 -
AspectJ
Aspect-oriented programming先参考这篇文章:http://blog.youkuaiyun.com/onlyqi/article/details/7168050参考wiki:http://en.wikipedia.org/wiki/AspectJAspectJ Programming Guide:http://www.eclipse.org/as转载 2011-12-31 16:34:05 · 1156 阅读 · 0 评论 -
邮件协议POP,POP3,SMTP,IMAP
概念POP: Post Office Protocol 它规定怎样将个人计算机连接到Internet的邮件服务器和下载电子邮件的电子协议。POP3:simply POP, lets you download email from online accounts to your computerusing email programs or email clients.例如outlo原创 2012-01-01 10:45:17 · 4044 阅读 · 0 评论 -
Aspect-oriented programming
我们对面向过程和面向对象的编程语言已经耳熟能详了。今天来看看Aspect-oriented programming,也就是面向行为的编程。参考wiki,写的很不错:http://en.wikipedia.org/wiki/Aspect-oriented_programming什么是AOPIn computing, aspect-oriented pr原创 2011-12-31 12:46:48 · 3089 阅读 · 0 评论 -
cron syntax
我在java程序里调用一个第三方schedular类库quartz的时候,就注意到里面schedular的语法像这个样子:0 */2 * * *当初就觉得怪怪的,总也记不住,今天才知道原来这是cron syntax。同时Jenkins中的定时任务使用的scheduler也是使用cron语法定义的。还有在spring中引用的定时任务。Cron in UNIXCro原创 2011-12-17 16:54:11 · 2645 阅读 · 0 评论 -
FTP工作方式介绍
本文参考了维基百科中ftp的条目。FTP server早期的FTP server都是命令行形式的。后来发展出了图形化ftp工具。常用的有CuteFTP, Filezilla等。很多linux,solaris都自带ftp工具。FTP的两个连接FTP(file transfer protocol) 位于OSI模型的应用程序层,用于传输文件,它是基于TCP/TP的翻译 2012-06-28 08:10:29 · 1717 阅读 · 0 评论 -
端口转发
今天遇到一个问题:一个发送java message到开发环境的TIBCO服务器C的程序在开发机器B上运行时遇到问题,想在本地自己机器A上debug一下。但问题是本地A只能连接到开发机器B,不能连接到开发环境的TIBCO服务器C(防火墙的原因,JMS服务用的是7222端口)。因此在A上eclipse里debug程序时,一直报错"cant connect to remote server C"原创 2012-07-04 15:43:08 · 1812 阅读 · 0 评论 -
Cygwin
Cygwin项目的目的是使unix程序可以在windows上运行。它是一个在windows平台上运行的unix模拟环境。Cygwin同时也包含很多可在windows运行的unix开源软件,也包含了修改过的gcc,gdb,gas等开发工具,使他们能够生成并解释win32的目标文件。GNU--GNU is a Unix-like computer operating system develo转载 2012-09-29 10:51:50 · 856 阅读 · 0 评论 -
XML(一)--基本概念
关于XML的完整内容可以参考:http://www.w3schools.com/schema/default.asp左边可以看到一个 XML Tutorial,下面包括了XML相关的所有主题。什么是XMLXML was designed to transport and store data.顺便提了一句,虽然大家现在看到的HTML也是XML格式的,但HTM原创 2011-11-21 14:36:54 · 782 阅读 · 0 评论 -
XML(二)--扩展知识
这篇文章是关于XML常见知识的高度概括,更具体的细节参考每个知识点下的链接。包含:XML Schema or XSD (XML Schema Definition)XML DTDXML DOMXML CSSXML XSLTXML CDATAXML NamespacesXML parserXML Schema or XSD & XML DTD原创 2011-11-21 14:41:23 · 1002 阅读 · 0 评论 -
VNC
我们在windows中,如果想远程操作另外一个windows机器,就用windows自带的远程桌面就可以了。但如果远程操作的机器不是windows,而是linux或unix,则不能使用windows的远程桌面。此时需要使用VNC。Virtual Network Computing (VNC) is a graphical desktop sharing system that uses原创 2012-11-15 11:35:47 · 1238 阅读 · 0 评论 -
XML(三)--java开发常用API
JAXB (Java Architecture for XML Binding)java对XML的支持http://www.oracle.com/technetwork/articles/javase/index-140168.html XML dom parserXML dom的概念大家已经知道了,parser就是用来做XML和dom转换的。http://blog.csd原创 2012-11-15 17:51:20 · 1069 阅读 · 0 评论 -
XML entity
很简单的一篇解释:http://www.tizag.com/xmlTutorial/xmlentity.phphttp://www.ibm.com/developerworks/xml/library/x-entities/转载 2012-12-24 13:21:55 · 799 阅读 · 0 评论 -
正则表达式
首先说两个概念,在后面我们会用到它们:metacharacter--元字符,即在正则表达式中有特殊意义的一些字符A metacharacter is one or more special characters that have a unique meaning, for example, the character ^ (circumflex or caret) is a metach原创 2011-11-28 23:14:15 · 933 阅读 · 0 评论 -
15 Practical Linux cURL Command Examples
http://www.thegeekstuff.com/2012/04/curl-examples/转载 2013-01-29 10:40:11 · 713 阅读 · 0 评论