文字和语言vs数字和信息
- 1、语言和数学的产生都是为了一个目的:记录和传播信息。
- 2、文字本身的载体是纸张还是石头不重要,它所承载的信息才是最重要的。
- 3、信息的冗余是信息安全的保障;双语或者多语的预料对翻译至关重要,它是我们从事机器翻译研究的基础。
- 4、从象形文字到拼音文字是一个飞跃,因为人类在描述物体的方式上,从物体的外表进化到了抽象的概念,同时不自觉的采用了对信息的编码。
- 5、常用字笔划短,生僻词笔划长,完全符合最短编码原理;口语易懂,文言文难懂,符合“在通信时,信道宽,信息不必压缩直接传递,信道窄,信息在传递前尽可能的压缩,然后在接收端进行解压”。
- 6、从字母到词的构词法(morphology)是词的编码规则,那么语法则是语言的编码和解码规则。词可以被认为是有限而且封闭的集合,而语言则是无限且开放的集合。