ruby1.9的中文处理


# -*- coding: utf-8 -*-


Matz在谈到ruby的m17n的时候说道:

[quote]除了字符操作上会出现一些不兼容外,也没什么了,比如”abc”[0]将返回’a’而不是97,并且字符串索引(string indexing)将基于字符而不是字节(译者注:中文及其它一些多字节语言每个字符可能需要占据多个字节),我想如果要说最大的变化,那就是我们可以宣称我们现在支持Unicode了。

但是与Perl或者Python不同,Ruby的M17N不会基于Unicode实现,它将会是字符编码独立的(character set independent ,CSI),它将能够处理Unicode,ISO8859,EUC-JP或者是别的随便什么编码,而不用将他们转换为Unicode。

有些人可能会产生误解,以为我们仇恨Unicode,其实不是这样的,如果条件允许的话,我当然也很乐意使用Unicode,但是由于历史的原因,有很多的编码规范(比如Shift_JIS就有至少5中变化),它们之间只是在某些字符的映射上存在一些小差异,但不幸的是,我们无法区别它们,因此如果强行将它们转换为Unicode,将会造成信息丢失。[/quote]

果然是因为日文的编码==||
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值