使用LISP自动发现数据中有趣关系的技术
1. 引言
能够自动“发现”大量数据中有趣特征的计算机程序,无疑具有极大的实用价值。区分和阐明数据中的关系是一个极其复杂的问题。在数据简化和分析的有限背景下,该问题的完整解决方案仍需等待创建一个庞大且编程精良的计算设施。在此期间,一个功能稍弱但能快速识别和理解传入数据中重要关系的机器,对实验人员及其他需要处理数据的人来说将非常有用,例如战场上的指挥官需根据原始数据进行指挥。
2. 模型情况
一个可行的中间目标是创建一个计算机程序,该程序可处理数值数据,以适当方式描述数据,自动发现数据中的有趣关系,并将这些关系告知用户。起初,此类程序可能仅限于简单情况和简单数据形式,但随着时间、经验和努力的积累,其功能有望显著提升,推动计算机技术的发展。
3. 什么是“有趣”
开发过程的第一步是对“有趣”进行定义,该定义需足够客观、精确和简单,以便形成算法定义。此定义是区分“有趣”和“无趣”数据的计算机程序的基础。在定义时,需考虑数据的背景或上下文。例如:
- 企鹅在南极不有趣。
- 企鹅在动物园不有趣。
- 波士顿的动物园不有趣。
- 波士顿且不在动物园的企鹅有点有趣。
假设考虑的是连续的数字流,数字本身可能无趣,有趣之处在于数字的特征。例如,对于序列“7, 7, 7, 7…”,有趣的表述是“该序列由一系列7组成”,而逐个列举每个位置是7则无趣。一般来说,数据中的有趣关系隐含在数据的最短描述中。区分有趣和无趣信息的目标是保留有趣信息,舍弃无趣信息。计算机能轻松存储任意长的随机数列表,但人类记忆随机数的能力有限,通常只能短时间记住少量随机数。为长时间
超级会员免费看
订阅专栏 解锁全文
45

被折叠的 条评论
为什么被折叠?



