Localization
文章平均质量分 81
the3gwireless
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
本地化术语(Localization Terminologies)
Hot key (热键):菜单命令和对话框选项中带有下划线的字母或数字。通过按下Alt键和下划线的字母或数字,可以机或命令和选项。 Hypertext Markup Language (超文本标示语言):SGML语言的子集。定义了一组标示符控制页面内容的显示方式。 Input Method Editor-IME (输入方法编辑器):通过按下键盘的多个键完成输入本地化文字的应用工具。对于汉字,常用的原创 2007-01-06 14:53:00 · 1578 阅读 · 0 评论 -
最基本也是最常用的一些正则表达式
匹配中文字符的正则表达式: [/u4e00-/u9fa5]评注:匹配中文还真是个头疼的事,有了这个表达式就好办了匹配双字节字符(包括汉字在内):[^/x00-/xff]评注:可以用来计算字符串的长度(一个双字节字符长度计2,ASCII字符计1)匹配空白行的正则表达式:/n/s*/r评注:可以用来删除空白行匹配HTML标记的正则表达式:]*>.*?|评注:网上流传的版本太糟糕,上面这个也转载 2007-08-14 12:12:00 · 655 阅读 · 0 评论 -
ADODB.Stream组件Charset属性值集合
网上相关资源比较难找,和大家分享ADODB.Stream组件Charset属性值集合CODE:ANSI_X3.4-1968|iso-8859-1 ANSI_X3.4-1986|iso-8859-1 arabic|iso-8859-6 ascii|iso-8859-1 ASMO-708 Big5 chinese|gb2312 CN-GB|gb2312 cp1256|windows-1256原创 2008-01-22 09:24:00 · 1091 阅读 · 0 评论 -
语言和编码自动检测方法
我在网上找到这篇文档,相当全面,和大家分享。 A composite approach to language/encoding detection Shanjian Li (shanjian@netscape.com)Katsuhiko Momoi (momoi@netscape.com)Netscape Communications Corp. 1. Summa转载 2008-01-16 18:58:00 · 1004 阅读 · 0 评论 -
Google AJAX Language API
Very good materials:http://code.google.com/apis/ajaxlanguage/documentation/reference.html 值得研究一下。转载 2008-06-16 11:41:00 · 440 阅读 · 0 评论 -
Moses 解码工作原理研究 - 开始
为了简化研究,找了老的版本,用VC编译成功,运行没什么问题,第一感觉是太慢,所有table都要加载到内存,大数据量绝对是死,但是为了研究基本思路和理论应该足够了。计划,目前只针对Phase -based MT:第一步是想从代码级了解在数据结构上,语言模型,phase table 都是怎么加载到内存里的?什么结构能保证快速搜索?第二步是想知道Moses通过什么路径找到最佳候选翻译?语言模原创 2013-06-19 18:32:44 · 716 阅读 · 0 评论 -
Moses 解码工作原理研究 - 加载语言模型
今天看了语言模型的加载,终于搞明白了,是按照树型结构。 举例:LM table 如下(省略概率值,只列出了短语):1-gramabc2-gramsa ba cc bb ac a3-gramsc b a加载到内存后形成三个树对象:a----b----c |---cb---- a |---cc原创 2013-06-19 18:34:03 · 819 阅读 · 0 评论 -
Moses 解码工作原理研究 - 短语表
短语表片断:this is ||| 领 用 ||| 0.000977302 4.27099e-06 8.07779e-05 3.56845e-09 2.718 |||0-0 1-1 ||| 365 4416 1this is ||| 首先 ||| 0.000143721 1.81006e-05 8.07779e-05 2.15e-05 2.718 ||| 0-0 ||| 248原创 2013-06-21 16:35:43 · 980 阅读 · 1 评论 -
每一个软件开发人员绝对必须掌握的关于 Unicode 和字符集的最基础的知识
ASCII 码------------------------------------------------------------------------------------ 7 位(00~7F)。 32 ~ 127 表示字符。32 是空格, 32 以下是控制字符(不可见)。第8位没有被使用。全世界很多人同时对这个位的含义发展了不同的用处。比如 IBM PC 中的 OEM 字符集。最后转载 2007-08-09 15:45:00 · 734 阅读 · 0 评论 -
Java 和 .NET 自动字符编码识别程序库
什么是jchardet?jchardet是mozilla自动字符集探测算法代码的java移植,其源代码可以从sourceforge下载。这个算法的最初作者是frank Tang,C++源代码在http://www.infomall.cn/cgi-bin/mallgate/20040514/http://lxr.mozilla.org/mozilla/source/intl/chardet转载 2007-08-13 10:37:00 · 1912 阅读 · 0 评论 -
在UltraEdit的查找和替换中使用正则表达式
在UltraEdit的查找和替换中使用正则表达式 很多朋友都用过或者正在用UltraEdit,这个编辑器陪伴我也好几年了,从很多地方影响着我写代码的快捷键习惯,Ultraedit提供了非常丰富的编辑功能,其中非常重要的查找和替换功能一定大家都用过,Ultraedit提供的查找替换功能非常方便和强大,可以在单独文件里面查找替换,也可以在多个文件、多个目录里面进行查找替换。而我们在使用这转载 2007-06-29 16:45:00 · 1127 阅读 · 0 评论 -
在MS WORD里进行查找和替换的高级技巧
Find and replace text or other items with MS WordSome of the content in this topic may not be applicable to some languages.Use Microsoft Word to find and replace text, formatting, pa原创 2007-06-29 17:06:00 · 1674 阅读 · 0 评论 -
Unicode字符编码分布表――语言文字类
Unicode字符编码分布表――语言文字类 欧洲字母 非洲文字 印度文字原创 2007-06-29 16:34:00 · 1336 阅读 · 0 评论 -
正则表达式介绍及其在EmEditor的应用
正则表达式介绍及其在EmEditor的应用 正则表达式实在包含的内容太多, 仅仅用一篇文章来涵盖是没可能的了, 所以我只是简要的做些介绍和基本的模式应用举例. 即使这样也需要多次分章节的来连载了~~~ 闲话少说, 以下正文:正则表达式, 英文 Regular expression, 简写Regexes或Regex. 应用概述: 提供与预期的搜索结果匹配的原创 2007-07-12 12:13:00 · 2457 阅读 · 1 评论 -
Html 实体(Entities)
Note that the entity names are case sensitive.原创 2007-08-01 17:45:00 · 1635 阅读 · 0 评论 -
Regular Expression Cheat Sheet (.NET)
Regular Expression Cheat Sheet (.NET) Metacharacters Defined转载 2007-08-02 09:20:00 · 796 阅读 · 0 评论 -
如何在EXCEL里将两列的内容连接起来
Joining Two Text Columns I teach a class on Power Excel at the University of Akron. Although i转载 2007-08-04 21:14:00 · 3446 阅读 · 0 评论 -
史上最全的代码页(CodePage)和字符集(Character Sets)
Character Sets And Code Pages At The Push Of A Button Code Pages, Character Encodings from原创 2007-08-07 18:42:00 · 4267 阅读 · 0 评论 -
Moses 解码工作原理研究 - 解码
翻译: this is a small house1. 将this is a small house 拆分成短语如下:this, this is, this is a, is, is a, is a small, a, a small, a small house, small, small house, house...2. 根据加载的短语表,参照上面拆分后的短语生成翻译选择原创 2013-07-11 18:04:40 · 872 阅读 · 0 评论
分享