- 博客(108)
- 资源 (5)
- 收藏
- 关注
原创 Moses 解码工作原理研究 - 解码
翻译: this is a small house1. 将this is a small house 拆分成短语如下:this, this is, this is a, is, is a, is a small, a, a small, a small house, small, small house, house...2. 根据加载的短语表,参照上面拆分后的短语生成翻译选择
2013-07-11 18:04:40
840
原创 Moses 解码工作原理研究 - 短语表
短语表片断:this is ||| 领 用 ||| 0.000977302 4.27099e-06 8.07779e-05 3.56845e-09 2.718 |||0-0 1-1 ||| 365 4416 1this is ||| 首先 ||| 0.000143721 1.81006e-05 8.07779e-05 2.15e-05 2.718 ||| 0-0 ||| 248
2013-06-21 16:35:43
946
原创 Moses 解码工作原理研究 - 加载语言模型
今天看了语言模型的加载,终于搞明白了,是按照树型结构。 举例:LM table 如下(省略概率值,只列出了短语):1-gramabc2-gramsa ba cc bb ac a3-gramsc b a加载到内存后形成三个树对象:a----b----c |---cb---- a |---cc
2013-06-19 18:34:03
794
原创 Moses 解码工作原理研究 - 开始
为了简化研究,找了老的版本,用VC编译成功,运行没什么问题,第一感觉是太慢,所有table都要加载到内存,大数据量绝对是死,但是为了研究基本思路和理论应该足够了。计划,目前只针对Phase -based MT:第一步是想从代码级了解在数据结构上,语言模型,phase table 都是怎么加载到内存里的?什么结构能保证快速搜索?第二步是想知道Moses通过什么路径找到最佳候选翻译?语言模
2013-06-19 18:32:44
694
原创 .NET如何获取字符串中某一字符的整数值 (c#中与javascript内的charCodeAt相同的方法)
javascript 返回一个整数,代表指定位置上字符的 Unicode 编码。 语法:strObj.charCodeAt(index) C# .NET (int) strObj[index]
2009-06-17 09:48:00
2387
原创 .NET 如何转换十进制整数到十六进制字符串
在网上找到如下两个方法,请自行验证: strChrAsciiHexValue = String.Format("{0:X2}", intChar);((int) c).ToString("x"), c is a char.
2009-06-17 09:44:00
889
转载 .Net如何转换16进制字符串到10进制整数
原链接:http://aspadvice.com/blogs/name/archive/2007/09/12/How-to-Convert-from-hex-to-int.aspxHow to Convert from hex to intI recently needed to convert hexadecimal numbers into integer numbers.
2009-06-17 09:40:00
731
转载 AJAX框架大全 (AJAX Frameworks)
AJAX 框架大全,原文参考:http://www.open-open.com/67.htm DWR DWR(DirectWebRemoting)是一个WEB远程调用框架.利用这个框架可以让AJAX开发变得很简单.利用DWR可以在客户端利用JavaScript直接调用服务端的Java方法并返回值给JavaScript就好像直接本地客户端调用一样(DWR根据Java类来动态生成Java
2008-12-19 16:38:00
2093
转载 Google AJAX Language API
Very good materials:http://code.google.com/apis/ajaxlanguage/documentation/reference.html 值得研究一下。
2008-06-16 11:41:00
425
原创 Google, Yahoo 和 Baidu的比较
看了很多网上的评论,据说Baidu在国内搜索是无可争议的老大。平时一直用Google, 今天试着用这三个不同的搜索Engine搜索了一下"the3gwireless"这个关键字,结果如下图:从上面结果可以看出来,很明显Google从精度和信息量来说,都是首屈一指,百度信息量够,可是精度就差一点了,Yahoo虽然精度很高,把我的Blog首页作为第一条记录,但是信息量相比,就差了一
2008-01-25 22:45:00
646
原创 ADODB.Stream组件Charset属性值集合
网上相关资源比较难找,和大家分享ADODB.Stream组件Charset属性值集合CODE:ANSI_X3.4-1968|iso-8859-1 ANSI_X3.4-1986|iso-8859-1 arabic|iso-8859-6 ascii|iso-8859-1 ASMO-708 Big5 chinese|gb2312 CN-GB|gb2312 cp1256|windows-1256
2008-01-22 09:24:00
1060
转载 语言和编码自动检测方法
我在网上找到这篇文档,相当全面,和大家分享。 A composite approach to language/encoding detection Shanjian Li (shanjian@netscape.com)Katsuhiko Momoi (momoi@netscape.com)Netscape Communications Corp. 1. Summa
2008-01-16 18:58:00
964
转载 深入挖掘Windows脚本技术
本文转载自:http://www.xfocus.net/articles/200411/752.html很强的文章,和大家分享。深入挖掘Windows脚本技术【目录】1,前言2,回顾WSH对象3,WMI服务4,脚本也有GUI5,反查杀6,来做个后门7,结语8,参考资料【前言】本文讲述一些Windows脚本编程的知识和技巧。这里的Windows脚本是指"Windows Script
2007-08-20 18:21:00
910
原创 快速保存当前网页全部图片GetImages.js源代码
/**//************************************************************************************************//**//**** File: GetImages.js
2007-08-19 11:25:00
2776
原创 利用Javascript快速保存当前网页中的所有图片
利用Javascript快速保存当前网页中的所有图片 工作中,我经常会用到Windows Script, 因此在我的Blog上有这个专栏,把平时学到看到的记录下来,但是我自己一直没有发表过真正有用的脚本,工作中的那些由于涉及到公司机密,不方便也不能在这里发表,一直觉得很遗憾。周末闲的无聊,上了很多网站浏览,看到好的图片,总想保存下来,但是使用浏览器自带的保存功能时,觉的非常麻烦。如果
2007-08-17 17:48:00
5654
4
转载 如何使用Microsoft Excel 数据透视表 (PivotTables)
How to Use Microsoft Excel PivotTablesA Business Software Tip by J. Carlton Collins, CPAAccountants have long known the value of PivotTables. But theyre a great data analysis tool for management,
2007-08-16 12:27:00
10672
转载 Windows Script 脚本程序员必须要学习的网页:"嗨,Scripting Guy!"
嗨,Scripting Guy! 2007 年 04 月 • 2007 年 04 月 20 日當週
2007-08-16 09:53:00
1465
转载 Javascript高级应用:文件操作篇
Javascript高级应用:文件操作篇 一、功能实现核心:FileSystemObject 对象其实,要在Javascript中实现文件操作功能,主要就是依靠FileSystemobject对象。在详细介绍FileSystemobject对象的各个属性和方法的使用细节前,先来看看这个对象包括哪些相关对象和集合:二、FileSystemObject编程三部曲使用FileSystemO
2007-08-14 16:12:00
697
转载 调用IE的“另存为”来保存网页的VBS脚本
原文出自:http://www.et8.net/bbs/showthread.php?t=861717firefox是我的主流浏览器,经常要把网页保存为mht格式但MAF扩展用得很不顺手,又实在厌倦了firefox与ie间的频繁切换于是写了这个脚本,减少点重复劳动总是好的^o^代码:=========================================
2007-08-14 12:14:00
1459
转载 最基本也是最常用的一些正则表达式
匹配中文字符的正则表达式: [/u4e00-/u9fa5]评注:匹配中文还真是个头疼的事,有了这个表达式就好办了匹配双字节字符(包括汉字在内):[^/x00-/xff]评注:可以用来计算字符串的长度(一个双字节字符长度计2,ASCII字符计1)匹配空白行的正则表达式:/n/s*/r评注:可以用来删除空白行匹配HTML标记的正则表达式:]*>.*?|评注:网上流传的版本太糟糕,上面这个也
2007-08-14 12:12:00
625
转载 Java 和 .NET 自动字符编码识别程序库
什么是jchardet?jchardet是mozilla自动字符集探测算法代码的java移植,其源代码可以从sourceforge下载。这个算法的最初作者是frank Tang,C++源代码在http://www.infomall.cn/cgi-bin/mallgate/20040514/http://lxr.mozilla.org/mozilla/source/intl/chardet
2007-08-13 10:37:00
1887
转载 每一个软件开发人员绝对必须掌握的关于 Unicode 和字符集的最基础的知识
ASCII 码------------------------------------------------------------------------------------ 7 位(00~7F)。 32 ~ 127 表示字符。32 是空格, 32 以下是控制字符(不可见)。第8位没有被使用。全世界很多人同时对这个位的含义发展了不同的用处。比如 IBM PC 中的 OEM 字符集。最后
2007-08-09 15:45:00
706
原创 史上最全的代码页(CodePage)和字符集(Character Sets)
Character Sets And Code Pages At The Push Of A Button Code Pages, Character Encodings from
2007-08-07 18:42:00
4113
转载 如何在EXCEL里将两列的内容连接起来
Joining Two Text Columns I teach a class on Power Excel at the University of Akron. Although i
2007-08-04 21:14:00
3388
转载 Regular Expression Cheat Sheet (.NET)
Regular Expression Cheat Sheet (.NET) Metacharacters Defined
2007-08-02 09:20:00
779
原创 使用Windows Script遍历一个XML文件
var objArgs = WScript.Arguments;if (WScript.Arguments.Count() == 0)...{ showUsage();}else ...{ processFile(WScript.Arguments(0));}function showUsage()...{ WScript.Echo("*****************
2007-08-01 18:08:00
703
原创 最好用的Windows Script 编写工具(BrineSoft Script Editor)
个人觉得已经是目前最好的Windows Script 编写工具了。可以从这里获取该软件:http://www.brinesoft.com/如果各位网友有不同看法,请留言。
2007-08-01 17:55:00
1084
原创 使用Windows Script快速更改本机IP地址设置
有的时候,我们需要经常更换本机IP地址,比如设置使用不同的代理服务器等:可以使用以下的脚本:Rem Script created: 24.04.2007 09:54Rem Author: Sam HuangstrComputer = "."strAnswer=MsgBox ("Use 192.168.20.57 / 24?" & vbCrLf & vbCrLf & "If not, y
2007-07-12 12:18:00
1454
原创 正则表达式介绍及其在EmEditor的应用
正则表达式介绍及其在EmEditor的应用 正则表达式实在包含的内容太多, 仅仅用一篇文章来涵盖是没可能的了, 所以我只是简要的做些介绍和基本的模式应用举例. 即使这样也需要多次分章节的来连载了~~~ 闲话少说, 以下正文:正则表达式, 英文 Regular expression, 简写Regexes或Regex. 应用概述: 提供与预期的搜索结果匹配的
2007-07-12 12:13:00
2412
1
原创 在MS WORD里进行查找和替换的高级技巧
Find and replace text or other items with MS WordSome of the content in this topic may not be applicable to some languages.Use Microsoft Word to find and replace text, formatting, pa
2007-06-29 17:06:00
1626
转载 在UltraEdit的查找和替换中使用正则表达式
在UltraEdit的查找和替换中使用正则表达式 很多朋友都用过或者正在用UltraEdit,这个编辑器陪伴我也好几年了,从很多地方影响着我写代码的快捷键习惯,Ultraedit提供了非常丰富的编辑功能,其中非常重要的查找和替换功能一定大家都用过,Ultraedit提供的查找替换功能非常方便和强大,可以在单独文件里面查找替换,也可以在多个文件、多个目录里面进行查找替换。而我们在使用这
2007-06-29 16:45:00
1083
转载 软件测试基础
一、软件测试概述软件测试是软件开发过程的重要组成部分,是用来确认一个程序的品质或性能是否符合开发之前所提出的一些要求。软件测试的目的,第一是确认软件的质 量,其一方面是确认软件做了你所期望的事情(Do the right thing),另一方面是确认软件以正确的方式来做了这个事件(Do it right)。第二是提供信息,比如提供给开发人员或程序经理的反馈信息,为风险评估所准备的信息。第三
2007-03-14 11:11:00
1083
1
转载 Web下的整体测试
注:本文转载cwj007 在51testing上的博客文章(http://blogold.51testing.com/cwj007)随 着Internet的日益普及,现在基于B/S结构的大型应用越来越多,可如何对这些应用进行测试成为日益迫切的问题。有许多测试人员来信问我B/S的测 试如何做,由于工作较繁忙,对大家提出的问题也是头痛医头脚痛医脚,没有对WEB的测试过程做一个整体的概述。希望通过本篇能
2007-03-14 11:05:00
566
转载 黑盒测试的测试用例设计方法
·等价类划分方法·边界值分析方法·错误推测方法·因果图方法·判定表驱动分析方法·正交实验设计方法·功能图分析方法等价类划分:是把所有可能的输入数据,即程序的输入域划分成若干部分(子集),然后从每一个子集中选取少数具有代表性的数据作为测试用例.该方法是一种重要的,常用的黑盒测试用例设计方法.1) 划分等价类: 等价类是指某个输入域的子集合.在该子集合中,各个输入数据对于揭露程序中的错误都是等效的.并
2007-03-14 10:50:00
683
原创 黑盒测试之边界值分析、错误猜测
边界值分析法,有较好的测试回报率。该法较简单,仅是用于考察正处于等价划分边界或在边界附近的状态。因此,只需明确边界条件这一定义即可。边界条件,是指输入和输出等价类中那些恰好处于边界、或超过边界、或在边界以下的状态。 错误猜测法,没有用到任何特殊的方法,只是利用直觉和经验猜测出错的可能 类型,然后编写测试用例来暴露这些错误。基本思想是列举出可能犯的错误或错误易发情况的清单,然后依据清单来
2007-03-14 10:47:00
696
原创 本地化术语(Localization Terminologies)
Hot key (热键):菜单命令和对话框选项中带有下划线的字母或数字。通过按下Alt键和下划线的字母或数字,可以机或命令和选项。 Hypertext Markup Language (超文本标示语言):SGML语言的子集。定义了一组标示符控制页面内容的显示方式。 Input Method Editor-IME (输入方法编辑器):通过按下键盘的多个键完成输入本地化文字的应用工具。对于汉字,常用的
2007-01-06 14:53:00
1517
转载 软件加密技术和注册机制
软件加密技术和注册机制 本文是一篇软件加密技术的基础性文章,简要介绍了软件加密的一些基本常识和一些加密产品,适用于国内软件开发商或者个人共享软件开发者阅读参考。 1、加密技术概述 一个密码系统的安全性只在于密钥的保密性,而不在算法的保密性。 对纯数据的加密的确是这样。对于你不愿意让他看到这些数据(数据的明文)的人,用可靠的加密算法,只要破解者不知道被加密数据的密码,他就
2006-12-21 14:48:00
974
J2ME(MIDP2.0)图像处理演示程序(完整源代码)增强版
2008-01-26
MSN手机客户端1.1.6
2008-01-26
GetImages
2007-09-14
HiBoss老板键1.0
2007-09-14
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人