论分类(一)

本文探讨了数学分类的概念及其在现实生活中的应用。介绍了通过量化事物并利用数学模型进行分类的方法,强调了经验学习的重要性。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

在这里我们探讨的一个话题,分类。首先说下为什么要分类以及它的意义,在我们的世界里有很多不同的东西需要我们去研究,然而由于现实世界的纷繁复杂,千头万绪,我们很难一下子看出所有事物的特性,为了降低我们的研究事物的难度,也为了能够更好的认清事物,我们对世界上的东西进行了分门别类的研究处理,打个比方,例如生物学上,我们把生物分成了,原核生物、真核生物、病毒,而后针对每样事物进行研,由于同一类别的事物有他们的共性之处,这样可以做到触类旁通事半功倍,同时也更好的了解到了这些事物。在这里我们不去讨论哲学上广义的分类概念,我们来研究下数学上的分类概念。
        在数学上如何去定义分类这个含义呢,我们会想到分类就是将某个事物贴上标签的过程,例如,一个文本它是教育类的文章,我们就把它贴上"教育"这个标签,这个贴的过程就是分类。这里我们假设有一些标签集合F={A,B,C,D....},分类就是将现实的事物贴上这些指定的标签的过程。为了进一步的使得我们更好的利用数学知识来分析事物,我们需要将事物量化,就像计算机需要将连续的信号离散化一样,我们也需要将给定的事物进行量化,而量化所得结果我们将其定义在 Rn 欧氏空间中,我们先不详说量化的过程(这实际上是特征提取与选择加打分的过程)在以后的章节中我们再详细叙说。
        上面刚刚说到我们量化所得结果为Rn空间中的一个点 τ,分类就是将这些点贴上A,B,C,D等等其中之一的标签,换句话说就是判别给定的一个点 τ它是属于哪一个给定的集合。如何确定给定的一个点是否属于这个集合呢,一个想当然的想法就是看这个点是不是在这个集合中,这是最简单也是最有效的想法,可是现实是我们并不知道这个集合里的所有点亦或是即使知道集合的所有点但是判别成本太高,在这样的情况下又该如何去判别呢?这里我们回到人是怎么做的,现实情况下我们是如何确定一个事物属于哪一类的呢。在有具体判定标准的情况下,例如颜色区分,成绩的优劣,我们是利用这个给定的规则,而在没有具体判定标准的情况下,大多数也许会说:“它就是这个类别啊!”诸如此类的话,很显然他们是凭借自己的经验。在这我们进一步的明确目的,我们来讨论在没有明确判定标准下数学上我们该如何进行分类
        刚才说到在现实情况下我们是利用我们的经验来进行分类的,这里就要问了,“经验”是个什么东西,我们的经验又是从何而来的呢,又该如何利用经验来进行分类呢?下面我们来依次回答这些问题。
        经验,在哲学上指人们在同客观事物直接接触的过程中通过感觉器官获得的关于客观事物的现象和外部联系的认识。在日常生活中,亦指对感性经验所进行的概括总结,或指直接接触客观事物的过程。这里提到了一点,经验是我们对客观事物规律的总结,它反映在我们的人脑之中,在数学上这些存储在人脑之中的客观规律就是一些数学模型。也就是说人脑之中存储了了一些对现实世界抽象的数学模型,我们没有办法得知一个人脑之中存储的数学模型的具体细节,但是我们可以观察发现,人的这些经验模型不是天生就有的,而是通过后天的不断学习所得到的,换句话说人脑的这些经验模型可惜通过学习而得到,通过总结以往的观察结果来获取经验,这也就回答了我们的经验是从何而来的,答案是经验是从对以往的案例中学习而来。既然说到学习,也许你会问,我们是怎么通过案例学习的呢,对于人脑这是一个很复杂的问题,或许脑科学家某一天会给出我们一个完整而满意的答案,这里我们相对这个问题进行简化,我们想的是在数学上如何模仿人的这些学习能力,通过对以往的案例(也即样本)进行学习,往后的章节里我们探讨如何来进行来模仿人的学习能力,让我们继续当前的话题,来继续回答最后一个问题,利用怎样利用经验来进行分类,刚刚说到经验是数学模型,很自然利用经验分类也就变成了利用这些数学模型进行分类
        总结前述,在数学上我们对给定的事物进行分类,可以通过对给定样本的样本点,利用可以学习的模型性进行学习,而后再对以后给定的数据利用这个学习所得的模型进行分类,整个分类的过程就变成了判别Rn空间中的点所处在那个集合的问题。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值