- 博客(8)
- 资源 (3)
- 收藏
- 关注
转载 BM25算法浅析
来源 http://blog.youkuaiyun.com/sunlylorn/article/details/7005832 BM25 is a bag-of-words retrieval function that ranks a set of documents based on the query terms appearing in each document, regardless
2012-08-07 14:08:29
434
转载 Normalized Discounted Cumulative Gain
来自 http://www.domolo.com/?p=108 数学公式的细节: NDCG(全称为Normalized Discounted Cumulative Gain)[62]对传统的评价标 准做出了改进,这些改进基于以下两个原则: z 在信息检索中,相关可以分为多个级别,高度相关的文档比部分相关的 文档更有价值,其在评价中应该赋予更大的权值。 z 文档在序列中的位置越靠
2012-08-07 13:40:20
2598
原创 利用python的pexpect模块,自动登陆服务器
#!/usr/bin/env python # -*- coding: utf-8 -*- import pexpect import struct, fcntl, os, sys, signal import termios # 此函数用来设置合适的窗口大小 def sigwinch_passthrough (sig, data): # Check for bugg
2012-02-13 18:24:58
1552
原创 Berkeley DB的内存泄露问题
#include "../include/db.h" #include #include #include /* Open a database */ int open_db(DB **dbpp, const char *file_name, int is_secondary) { DB *dbp; u_int32_t open_fla
2012-01-16 19:48:33
561
转载 根据core找到对应的程序
例如: #strings core.21004 | grep _= _=./a.out strings的用法,请man.
2012-01-16 19:42:02
260
原创 Copying to tmp table on disk
产生这个步骤的原因是因为中间结果集太大了。 修改tmp_table_size这个参数,感觉不起作用,还是会有这一步。我都改成512M了,涉及的数据只有几十M啊,为啥子不行呢?
2011-09-15 15:55:57
906
原创 字节对齐问题
请看下面的一道题目#include #include #include typedef struct tagStTest{ char b; int a;}StTest;int main(){ StTest st1,st2; st1.a = 1; st1.b = 2; st2.a = 1; st2.b = 2; if(0 ==memcmp
2010-04-17 11:13:00
256
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人