
编程语言相关
文章平均质量分 89
西二旗小码农
爱搜索,爱互联网,愿意为之抛头颅洒热血,搜索推荐工程师一枚。
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
Howto: Connect MySQL server using C program API under Linux or UNIX
<br />MySQL database does support C program API just like PHP or perl.<br />The C API code is distributed with MySQL. It is included in the mysqlclient library and allows C programs to access a database.<br />Many of the clients in the MySQL source distrib转载 2011-05-09 11:27:00 · 649 阅读 · 0 评论 -
DBSCAN算法的Java实现
DBSCAN是一种基于密度的聚类算法,它的基本原理就是给定两个参数,ξ和minp,其中 ξ可以理解为半径,算法将在这个半径内查找样本,minp是一个以ξ为半径查找到的样本个数n的限制条件,只要n>=minp,查找到的样本点就是核心样本点,算法的具体描述见参考文件1,下边是这个算法的java实现: 首先定义一个Point类,代表样本点 package com.sunzhenx转载 2011-11-21 11:33:50 · 8351 阅读 · 3 评论 -
hadoop初学之WordCount程序一步一步运行
出处:http://blog.chinaunix.net/u3/105376/showart_2329753.html虽说现在用Eclipse下开发hadoop程序很方便了,但是命令行方式对于小程序开发验证很方便。这是初学hadoop时的笔记,记录下来以备查。1. 经典的WordCound程序(WordCount.java),见 hadoop0.18文档import jav转载 2011-11-10 00:05:32 · 1053 阅读 · 0 评论 -
LinkedHashMap 和 HashMap的区别
顾名思义LinkedHashMap是比HashMap多了一个链表的结构。与HashMap相比LinkedHashMap维护的是一个具有双重链表的HashMap,LinkedHashMap支持2中排序一种是插入排序,一种是使用排序,最近使用的会移至尾部例如 M1 M2 M3 M4,使用M3后为 M1 M2 M4 M3了,LinkedHashMap输出时其元素是有顺序的,而HashMap输出时是随机的转载 2011-12-06 12:14:07 · 468 阅读 · 0 评论 -
一些常用的开源分词工具
SCWS: Author:Hightman算法:基于词频词典的机械中文分词引擎,采用的是采集的词频词典,并辅以一定的专有名称,人名,地名,数字年代等规则识别来达到基本分词准确率:经小范围测试大概准确率在 90% ~ 95% 之间,已能基本满足一些小型搜索引擎、关键字提取等场合运用。性能:45Kb左右的文本切词时间是0.026秒,大概是1.5MB文本/秒, 语言和平台:SCWS转载 2011-12-11 11:20:40 · 2912 阅读 · 0 评论 -
MapReduce and K-Means Clustering
Google offers slides and presentations on many research topics online including distributed systems. And one of these presentations discusses MapReduce in the context of clustering algorithms.转载 2011-12-14 22:29:42 · 1101 阅读 · 0 评论 -
常用的数据结构的一点小区别
Vector和ArrayList在使用上非常相似,都可用来表示一组数量可变的对象应用的集合,并且可以随机地访问其中的元素。 Vector的方法都是同步的(Synchronized),是线程安全的(thread-safe),而ArrayList的方法不是,由于线程的同步必然要影响性能,因此,ArrayList的性能比Vector好。 当Vector或ArrayList中的元素超过转载 2012-01-04 11:53:23 · 664 阅读 · 0 评论 -
由Java中的Set,List,Map引出的排序技巧
一。关于概念: List接口对Collection进行了简单的扩充,它的具体实现类常用的有ArrayList和LinkedList。你可以将任何东西放到一个List容器中,并在需要时从中取出。ArrayList从其命名中可以看出它是一种类似数组的形式进行存储,因此它的随机访问速度极快,而LinkedList的内部实现是链表,它适合于在链表中间需要频繁进行插入和删除操作。在具转载 2012-02-20 17:25:42 · 761 阅读 · 0 评论 -
linux下vim命令详解
高级一些的编辑器,都会包含宏功能,vim当然不能缺少了,在vim中使用宏是非常方便的::qx 开始记录宏,并将结果存入寄存器xq 退出记录模式@x 播放记录在x寄存器中的宏命令稍微解释一下,当在normal模式下输入:qx后,你对文本的所有编辑动作将会被记录下来,再次输入q即退出了记录模式,然后输入@x对刚才记录下来的命令进行重复,此命令后可跟数字,转载 2012-03-01 11:41:44 · 487 阅读 · 0 评论 -
Python中使用中文的方法
先来看看python的版本: >>> import sys >>> sys.version '2.5.1 (r251:54863, Apr 18 2007, 08:51:08) [MSC v.1310 32 bit (Intel)]' (一) 用记事本创建一个文件ChineseTest.py,默认ANSI: s = "中文" print s 测试一下瞧瞧: E:转载 2012-03-01 11:25:10 · 626 阅读 · 0 评论 -
Linux下C语言编程基础(Makefile)
假设我们有下面这样的一个程序,源代码如下: /* main.c */ #include "mytool1.h" #include "mytool2.h" int main(int argc,char **argv) { mytool1_print("hello"); mytool2_print("hello"); } /* mytool1.h */ #ifn转载 2012-04-12 13:31:12 · 640 阅读 · 1 评论 -
Linux静态库和动态库
库从本质上来说是一种可执行代码的二进制格式,可以被载入内存中执行。库分静态库和动态库两种。 静态库和动态库的区别1. 静态函数库 这类库的名字一般是libxxx.a;利用静态函数库编译成的文件比较大,因为整个 函数库的所有数据都会被整合进目标代码中,他的优点就显而易见了,即编译后的执行程序不需要外部的函数库支持,因为所有使用的函数都已经被编译进去了。当然这也会成为他的转载 2012-04-12 17:34:25 · 522 阅读 · 0 评论 -
murmur:更快更好的哈希函数(字符串转64位hash值)
unsigned long long MurmurHash64B ( const void * key, int len, unsigned int seed ){ const unsigned int m = 0x5bd1e995; const int r = 24; unsigned int h1 = seed ^ len; unsigned int h2 = 0; con转载 2012-04-13 18:56:29 · 5096 阅读 · 0 评论 -
gtest框架的介绍与应用
【摘要】在本文中,作者根据之前使用gtest框架进行测试的经验,总结了一些使用方式和案例。 在这些案例中,我们可以了解到gtest框架的基本使用方法以及在我们日常测试中的应用,同时也能促进我们对于百度的btest的了解。在我们之后的测试工作中,可以根据各个项目的特点以及gtest、btest等测试框架的功用,进行协调和因势利导,将更多框架产品用于我们的测试工作中,使我们的测试工作更加正规、更加高效转载 2012-09-17 15:04:31 · 2233 阅读 · 0 评论 -
编辑距离
我们来看一个实际应用。现代搜索技术的发展很多以提供优质、高效的服务作为目标。比如说:baidu、google、sousou等知名全文搜索系统。当我们输入一个错误的query="Jave" 的时候,返回中有大量包含正确的拼写 "Java"的网页。当然这里面用到的技术绝对不会是我们今天讲的怎么简单。但我想说的是:字符串的相似度计算也是做到这一点的方法之一。字符串编辑距离: 是一种字符串之间转载 2011-10-21 15:14:44 · 559 阅读 · 0 评论 -
eclipse 修改默认编码
应该是中文操作系统的原因,eclipse默认的新项目的编码是GBK,出于对编码支持的考虑,项目组中最好统一要求是UTF-8编码进行开发。修改eclipse的配置,可以使得eclipse的新建项目的默认编码直接为UTF-8在菜单栏的Window->Preferences原创 2011-08-26 15:57:13 · 716 阅读 · 0 评论 -
【转载】在C语言中得到sqlite数据库中表的内容-->>为初学者而作
作者: zieckey ( zieckey@yahoo.com.cn )现在我们来写个C/C++程序,调用 sqlite 的 API 接口函数查询e数据库中表的内容。下面是一个C程序的例子,显示怎么使用 sqlite 的 C/C++ 接口. 这个函数调用sqlite3_open() 在 22 行打开数据库, sqlite3_get_table 在 40 行执行 SQL 命令, 并且sqlite3_close() 在 47 行关闭数据库连接。代码:// name: query_test_1.c// This原创 2011-05-10 16:36:00 · 939 阅读 · 0 评论 -
strcpy的实现代码
char * strcpy(char * strDest,const char * strSrc) { char * strDestCopy=strDest; //[3] if ((strDest==NULL)||(strSrc==NULL)) //[1] throw "Invalid argument(s)"; //[2] while ((*strDest转载 2011-06-07 11:14:00 · 987 阅读 · 0 评论 -
数据挖掘算法总结-kmeans算法
最简单的聚类算法原创 2011-05-07 09:06:00 · 1453 阅读 · 0 评论 -
使用Java操作文本文件的方法详解
<br /> 最初Java是不支持对文本文件的处理的,为了弥补这个缺憾而引入了Reader和Writer两个类,这两个类都是抽象类,Writer中write(char[] ch,int off,int length),flush()和close()方法为抽象方法,Reader中read(char[] ch,int off,int length)和close()方法是抽象方法。子类应该分别实现他们。 <br /><br /> 当我们读写文本文件的时候,采用Reader是非常方便的,比如FileRe转载 2011-05-07 11:31:00 · 618 阅读 · 0 评论 -
跟我一起写 Makefile
<br />陈皓 <br /><br />概述 <br />—— <br /><br />什么是makefile?或许很多Winodws的程序员都不知道这个东西,因为那些Windows的IDE都为你做了这个工作,但我觉得要作一个好的和professional的程序员,makefile还是要懂。这就好像现在有这么多的HTML的编辑器,但如果你想成为一个专业人士,你还是要了解HTML的标识的含义。特别在Unix下的软件编译,你就不能不自己写makefile了,会不会写makefile,从一个侧面说明了一个人是否转载 2011-05-08 01:01:00 · 536 阅读 · 0 评论 -
Java 101 : Hello World
<br />Editor's Note : When I first wrote this tutorial series, in late 1996, Java was a relatively new language. It had a lot of potential, but a relatively small following by today's standard. In rewriting this tutorial series, I was amazed at how things原创 2011-05-10 00:01:00 · 2675 阅读 · 0 评论 -
搜索引擎爱好者博客
不知不觉中自己也从事了搜索。这里积累一个搜索引擎学习资源。主要是一些做搜索人的博客吧。 http://forfuture1978.iteye.com/ 这个很不错啊。原创 2011-07-15 15:22:35 · 531 阅读 · 0 评论 -
C++虚函数 与java 接口
什么是接口?接口是包含一组虚方法的抽象类型,其中每一种方法都有其名称、参数和返回值。接口方法不能包含任何实现,CLR允许接口可以包含事件、属性、索引器、静态方法、静态字段、静态构造函数以及常数。但是注意:C#中不能包含任何静态成员。一个类可以实现多个接口,当一个类继承某个接口时,转载 2011-07-14 18:22:45 · 700 阅读 · 0 评论 -
【awk】2-awk准高级篇(又名实用手册)---UPDATE
导读:版本:1 gawk的主要功能 -----以行为单位来处理文件 2 如何执行gawk程序 3 文件、记录和字段4 模式和动作5 比较运算和数值运算6,gawk中基本的数值运算符。7 内部函数 1 随机数和数学函数 2 字符串的内部函数3 输入输出的内部转载 2011-07-17 17:41:06 · 1266 阅读 · 0 评论 -
awk】1-awk基础篇(又名UNIX.Shell.awk)
导读:1,awk基本语法2,比较操作符3,复合表达式4,next命令5,变量及变量赋值6,awk中的赋值操作符7,BEGIN和END8,内置变量 9,awk使用shell变量 10,awk中的三种流控制语句10.1 if语句10.2 while语句:10.3 for语句:11,转载 2011-07-17 17:40:12 · 788 阅读 · 0 评论 -
ketama开源库-一致性Hash的处理
Ketama的作者是Richard Jones,他的主页是 ☆ 作者主页: http://www.metabrew.com/article/libketama-consistent-hashing-algo-memcached-clients 需要了解一下这个第三方库的使用,库下原创 2011-07-18 14:02:01 · 2777 阅读 · 0 评论 -
Java中获取时间的几种方法
Java中关于时间的操作主要是:1、获取当前时间,和某个时间进行比较。此时主要拿long型的时间值。方法如下: 要使用 java.util.Date 。获取当前时间的代码如下Date date = new Date(); date.getTime() ;转载 2011-09-01 10:04:14 · 612 阅读 · 0 评论 -
linux 命令
巧妙使用“rm”命令 我们可以使用带“-r”参数的“rm”命令来删除一个非空目录,例如我们在命令行中输入“rm -r bbb”这样的命令,表示系统将把bbb目录中包含的所有文件和子目录全部删除掉。查看系统运行的进程信息原创 2011-09-01 10:01:04 · 542 阅读 · 0 评论 -
ICE 编程 client.cpp
// **********************************************************************//// Copyright (c) 2003-2006 ZeroC, Inc. All rights reserved.//// This copy of Ice is licensed to you under the terms described转载 2012-09-25 12:59:15 · 2267 阅读 · 0 评论