关于中文和分词,计算机通讯的思考

 

  1. 中文分词 为什么不用四角号码呢(方块字四个角加一个补码)?

         10604 30104 22770 80221 26000 67127 12013 42913 44214 30112 12900 21182 27106 77217

          西塞山前白鹭飞,桃花流水鳜鱼肥.

          要知道中文的四角号码之间是有天然的联系的,比如词\成语等,对中文分池的查找和分类绝对有帮助吧

    2.计算机的底层是01,10,00,11 组成的二进制流,中文不能传输四角号码流吗?

      这样对传输和识别都很有帮助吧. 四角号码流组合变化更多,也有中国传下来的识别方法,比什么16进制,64位处理中文要          快一些吧

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值