Chapter1 文字和语言 vs 数字和信息

本文探讨了不同文字系统的等价性及信息冗余的重要性,并通过实例分析了语言数据在翻译中的作用,以及数字表示法背后的编码原理。同时,文章还介绍了信道宽度对信息压缩的影响和古代校验码的应用。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

1、不同的文字系统在记录信息上的能力是等价的。进一步讲,文字只是信息的载体,而非信息本身。

2、信息的冗余是信息安全的保障。罗塞塔石碑上的内容是同一信息重复三次,因此只要有一份内容完好保留下来,原有的信息就不会丢失,这对信道编码有指导意义。

3、语言的数据,我们称之为语料,尤其是双语或多语的对照语料对翻译至关重要。

4、对于不同位数数字的表示,中国人和罗马人都用明确的单位来表示数字的不同量级,中国人是用个十百千万亿兆(兆本身又有两个含义:百万和万亿);罗马人用字符Ⅰ代表1,Ⅴ代表5,Ⅹ代表10,L代表50,C代表100,D代表500,M代表1000,再往上就没有了。这两种表示法都不自觉地引入了朴素的编码的概念。首先,它们都是用不同的符号代表不同的数字概念;第二,它们分别制定了解码的规则。在中国,解码的规则是乘法。200万的写法含义是2×100×10000;而在罗马,解码的规则是加减法—小数字出现在大数字左边为减,右边为加。比如ⅠⅤ表示5-1=4,ⅤⅡ表示5+2=7,ⅡⅩⅩ表示20-2=18。这个规则不仅复杂,而且很难描述大的数字和分数。

5、在通信时,如果信道较宽,信息不必压缩就可以直接传递;而如果信道很窄,信息在传递前需要尽可能地压缩,然后在接收端进行解压缩。

6、犹太人发明了一种类似于我们今天计算机和通信中校验码的方法。他们把每一个希伯来字母对应于一个数字,这样每行文字加起来便得到一个特殊的数字,同样对于每一列也是这样处理。在抄写《圣经》时,要检查每一行,每一列的校验是正确。

7、如果说从字母到词的构词法是词的编码规则,那么语法则是语言的编码和解码规则。


Reading notes —— The beauty of math.  2018/2/22 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值