- 博客(21)
- 资源 (4)
- 收藏
- 关注
原创 机器翻译Reranking和MERT的几点疑问
1. Och提出的MERT, 其论文和很多博主都说需要不断重复重复 “解码->n-best list-> weight tuning ”的过程,但是只是使用了rescore后 n-best list中得分最高的一个假设。调整了权重之后,为什么要重新解码呢? 语言中的singleton:翻译做“单件”,即只出现过一次的ngram
2014-03-13 18:35:20
1761
翻译 束搜索算法(Andrew Jungwirth 初稿)BEAM Search
·最近搜了几篇束搜索的文章,这篇最直白易懂,并有示例的详细步骤图解,比维基百科的更为合适,因此拿在这里,供参考。原文链接:Beam Search Algorithm (Draft by Andrew Jungwirth)束搜索算法本文目标:1.演示了如何在存储有限的情况下进行类似的宽度优先的图搜索算法,即束搜索,使用启发式函数和限定的束宽度beam width .2.强调在搜索
2014-02-20 11:04:24
12285
原创 自然语言处理 学习收藏网站_ 个人
记录一些遇到好的资源网站,个人之用,随时补充:机器翻译:http://www.statmt.org/机器翻译的论文,参考书,WMT2005-2013 的链接,相关工具包,语料,很全面的资源整合。
2014-02-18 20:19:36
1023
转载 Eclipse 快捷键
Ctrl+1 快速修复(最经典的快捷键,就不用多说了)Ctrl+D: 删除当前行 Ctrl+Alt+↓ 复制当前行到下一行(复制增加)Ctrl+Alt+↑ 复制当前行到上一行(复制增加)Alt+↓ 当前行和下面一行交互位置(特别实用,可以省去先剪切,再粘贴了)Alt+↑ 当前行和上面一行交互位置(同上)Alt+← 前一个编辑的页面Alt+→ 下一个编辑的页面(当然是针对
2014-01-07 14:18:16
658
原创 借一篇论文了解重要性采样
最近看了EMNLP2013上的一篇论文,Yang Y, Eisenstein J. A log-linear model for unsupervised text normalization[C]//Proc. of EMNLP. 2013.文中用序贯蒙特卡洛SMC or PF(Particle filter )的方法,利用序贯重要性采样Sequenctial Importance Samp
2014-01-03 19:11:16
5355
原创 jama 矩阵运算速度
最近写的一个程序设计矩阵与向量的乘法,跑起来特别慢,因此利用jama包来提高运算速度,对比了一下矩阵相乘的速度:jama 表示jama的运算速度,for表示最原始的for循环处理的速度:matix元素的值是(-3,3)之间的一个浮点型随机数:matrix size500*5001000*10002000*20003000*3000ja
2014-01-03 11:18:51
1431
1
转载 java和C中exp 指数和对数函数的快速实现
1: java的实现 转载于:http://martin.ankerl.com/2007/02/11/optimized-exponential-functions-for-java/Usually microoptimization is only done in C or C++, but it works quite well in Java too. For a project I
2013-12-18 13:08:48
3856
原创 QTCreater 调试入门问题
F1 查看帮助F2 跳转到函数定义(和Ctrl+鼠标左键一样的效果)Shift+F2 声明和定义之间切换F4 头文件和源文件之间切换Ctrl+1 欢迎模式Ctrl+2
2013-11-21 14:40:22
1401
原创 Ubuntu12 64位 SRILM 环境搭建 _from sratch
1. 安装依赖软件时 出现:E: Problem with MergeList /var/lib/apt/lists/cn.archive.ubuntu.com_ubuntu_dists_dapper_multiverse_binary-i386_Packages E: 无法解析或打开软件包的列表或是状态文件解决办法:sudo rm /var/lib/apt/lists
2013-11-06 15:25:06
1277
原创 64位 win7下nltk 环境搭建
之前重装了系统,nltk 要求重装,64位和32位混杂的时代,有些琐事还挺耗时呀!安装过程中遇到一些问题,记录备案一下:问题:1. win7 64位 python2.7 安装后 IDLE 无法启动2. win7 64位 nltk 安装3. Win7 64位 python easy_install 的安装1.根据官网建议,下载Python2.7.3 http:
2013-11-04 11:20:23
2300
原创 java解析xlsx和docx 文件
用PIO包解析office2007 的excel 和word文档,需要的jar包 有:pio.jar: http://poi.apache.org/download.htmldomj4.jar: http://www.java2s.com/Code/Jar/d/Downloaddom4jjar.htmxmlbeans-2.3.0.jar: http://www.jarfind
2013-07-02 21:37:27
2695
原创 两个任意阶阶乘数比较大小
描述:n!表示n的阶乘, n!!表示(n!)!,现在需要写一个方法比较两个任意阶数的数的大小,输入以字符串形式给出,例如:比较 6!!!! 和 48!!算法描述:1.先对输入进行归一化,即同时除掉相同的阶数,比较剩余部分的大小,比如:先将以上参数化简为: 6! !和48 比较大小;2.设化简后无阶乘符的数为simpleNum, 上例中simpleNum=48;含阶乘的数为 co
2013-04-17 20:53:40
2098
原创 Dijestra 最短路的java实现
问题描述:题目描述: 已知一个无向图G=(V,E),G 中任意两个顶点 u 、v 之间存在路径或者不存在路径,如果存在,则会有一个或者多个最短路径。给出两个顶点 u0 和v0,请用一种效率尽可能高的算法求u0和v0之间的所有的最短路径。 输入: 第1 行:图的顶点数 1<=N<10 和边数 1<=M<=N*(N-1)/2 ,第 2...M+1行:图中的边(u,v ,w),其
2013-04-16 01:17:16
1070
原创 Eclipse下第一个Servet 创建过程
1.搭建环境Win7x64的PC上已有:Elipse,JDK,Tomcat,即java和tomcat的运行环境已搭建好,环境变量也搞定了。在此基础上:下载 tomcat插件。http://www.eclipsetotale.com/tomcatPlugin.html#A3将zip文件解压,将解压后的文件夹拷贝到Elipse/plugin目录下。重启Eclipse,这时就可以看到
2013-03-16 17:57:52
900
原创 Python append与expand 区别
append() 与expand()区别:分别尝试以下方法,结果如下:mylist=[1,2,[3,4]] >>>[1,2,[3,4]]mylist.append(5) >>>[1, 2, [3, 4], 5]mylist.append([5]) >>>[1, 2, [3, 4], [5]]mylist.append([5,6]) >>>[1, 2,
2013-03-09 18:57:06
14691
2
原创 Python 字典 元祖 链表 常用方法 及概念区别
Python字典方法:常用的方法与字典相关习惯用法示例说明d={}创建一个空的字典,并将分配给dd[key]=walue分配一个值给一个给定的字典键d.keys()字典的键的链表list(d)字典的键的链表s
2013-03-09 18:38:11
1176
原创 聊天机器人Eliza 代码
Eliza是基于正则表达式替换的聊天软件,实现非常简单,以下是其Python代码:from util import reflectionspairs = ( (r'I need (.*)', ( "Why do you need %1?", "Would it really help you to get %1?", "Are you sure you ne
2013-03-02 21:54:53
4371
原创 与Eliza的第一次谈话
Eliza是个心理医师,60年代出生于MIT。以下是我们的第一次聊天:(>表示我的回答,其他为Eliza的话)Hello. How are you feeling today?>Not that bad,how are you?Why do you ask that?>well.Out of polite.How do you feel when you say that?
2013-01-31 21:00:46
1466
原创 逆序数求解
问题描述:对于n个数的一个排列排,A1,A2,……,Ak ,Aj,……An.如果存在k但Ak> Aj ,则称有一个逆序对存在,如 2 6 3 4 5 1,则有逆序(2,1),(6,3),(6,4),(6,5),(6,1),(3,1),(4,1),(5,1),逆序数为8.设计算法,对给定排序求解逆序数。设计思想:用二分法求解,将A分为两部分,AL和AH。分别求解两个的逆序数
2013-01-15 01:09:18
813
原创 SQL Server触发器 练习曲 股票标的插入数据表
目标:StockBid(stock_id, cust_id, flag, date, price, amount), 存储股票买入和卖出的标的,分别代表股票号,客户号,flag用来标识是买入还是卖出,标的日期,标的价格,以及标的数量。实现一个触发器,每当插入一条记录,检查是否可以成交,成交的条件是买入价大于等于卖出价,并且最老的标的优先成交。成交时如果一方(A)的标的数量小于另一方(B),
2012-12-15 03:37:11
699
A log-Linear Model for Unsupervised Text Normalization阅读笔记
2014-01-03
Deep learning via Hessian-free optimization
2013-11-22
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人