有个朋友问是否有藏语版习语言,当时回答直接支持,很简单。后经尝试,才发现还存在显示问题,特向那个朋友致歉,当时回答不准确。
GB18030-2005 是在早期GB2312,GB18030演变进化而来的,主要处理汉字和日韩文字显示的,并没有在双字节编码部分考虑我国少数民族文字和阿拉伯语、泰语等国外文字编码问题。 四字节部分通过直接映射统一码,实现了这些支持,但其内码为四字节。
习语言可以支持四字节编码的变量名等,参与编译没问题。但目前还是借用的 视窗环境显示的。
视窗不支持四字节国标内码,所以显示是个问题。
目前只有浏览器和OFFICE、WPS等字处理器使用统一码内码实现了少数民族文字、阿拉伯语、泰语等和汉字的混合显示。 国标四字节编码转换为统一码后,显示就没有问题。
我怀疑:所有truetype字体都是使用统一码内码进行字形编排的。 不知是否正确?
我还没见过支持四字节 GB18030-2005 内码文本显示的软件,你见过吗?
假如真没有还需要做更多工作: 一个图形驱动系统,一个 GB18030-2005 内码编排的字库, 一个配套的输入法,才能方便的做四字节内码直接显示。
实现个编辑器,才能直接编排 GB18030-2005 内码的文本。 不小的一个工程。 你有兴趣参与吗?
青海藏语广播网网站标题转换为国标码后的内码:

目前显示效果:


本文深入分析了GB18030-2005标准在处理汉字、日韩文字及少数民族文字时存在的显示问题,介绍了统一码在解决跨语言混合显示方面的作用。讨论了当前软件环境下支持四字节编码文本显示的现状,并提出了实现直接显示GB18030-2005内码文本所需的技术组件,包括图形驱动系统、字库、输入法和编辑器。
1万+

被折叠的 条评论
为什么被折叠?



