机器学习知识导入

本文探讨了世界看似无规律的现象背后可能隐藏的简单规则,并解释了机器学习如何通过重复和经验来揭示这些规则。重点阐述了机器学习的核心原理、与人类学习的相似之处及如何应用于现实世界的问题解决。

每隔一段时间如果没有看相关文献,就会把Machine Learning的知识忘了一些,所以打算写一篇来给将来的自己温故知新使用。

1、World?

        世界这么大,从表面上看充斥着有规律和无规律的事件。有规律,代表着已被人类归纳总结出来了,具有一定的周期性、原因可循以及未来可预测;再来看看所谓的无规律,实际上是相对”有规律“而定义的:发生随机、原因未知、未来不可测。

       问题来了,真的是这样吗?

       根据统计学基础,概率是基于大量重复试验,事件发生占比趋于稳定的一种可能性度量。请注意这里有个词是”重复“。实际上,我们所处的世界只是宇宙中极微小的一部分,因为我们观察到的事件都是发生在有限时间(最长不过宇宙爆炸到现在,或者人类文明到现在)、有限空间(地球上,更多时候是一个国家、一个地区)。在有限时间和空间内,有些事件自然不可能重复或大量重复,所以在人类认知范围内把它界定成”无规律“。

        马克思的哲学原理告诉我们,世界上事物之间是相互联系的,那么我们就试想一下,对于一些看似无规律事件,是否能通过和它相关的有规律物体或事件联系起来从而推导出这件事的发生规律呢?举个例子:千百年来我们都在寻找预测地震的方式,而人们除了直接从地质上去研究外,更多从天气、物种变化这些更显而易见的方式去寻找它们和地震之间的关系。原因就在于我们平时不太可能总是去关注脚下的这片土地成分和过去有什么不同,但我们可以从各种动物的表现去推测是否可能地震——这些也是源于人类感知有限的局限性。

       综上所述,时间、空间、感知的有限性,使得人类不得不去通过事物的关联去发现更多规律,以便让它们在自然中得到成长。老师在一门课上告诉过我们说:“学习完概率统计有时候会颠覆你对这个世界的看法。“对此我很赞同。先前你所认为的世界观也许是纷繁复杂,但是也许背后都是在用极其简单的规则在运作大自然这台大机器。”世界是简单的,亦是复杂的。“

     2、Why Machine Learning?

        从上一章我们知道,世界背后应是简单规则的交织和叠加。然而经过时间积累,它已经越来越复杂,要发现它背后的规律也越来越不容易。这一方面需要人类的共同智慧,另一方面也需要这样对世界具有极高理解的人划开一个口让众人的智慧从这个入口去挖掘更多东西。

       随着计算机的发展,由于人类在前几次的工业革命中都成功运用了机器来帮助解决生产、解放生产力,他们不禁思考:在这轮信息革命中机器(包括计算机)能帮助人类减少什么?体力劳动或者脑力劳动?

      我们回顾一下人类思考问题的模式:在无知时,我们通过感官接收来自外界的刺激(光、声、触觉),并且对这些刺激做出原始反应(婴儿的哭、摆手、踢腿);父母针对这些反应用外部的重复性动作加以训练,例如哭的时候会哄,顽皮时候不理孩子等等,经过重复训练后在大脑中形成了这样一种思维分路:哭得不到奖励,乖乖的可以获得奖励。以此为基础和经验,又再学习更复杂的行为,所以我们会发现无论教孩子发音或者动作父母都需要耐心地重复,孩子的大脑也会一直收到反馈与刺激直到学会为止。

       从以上我们发现了有两个关键词:重复、经验。如果说人类的大脑构造与反馈机制是人类学习的基础,那么重复和经验则是人类学习的方式,二者结合无疑具有很大的潜力。对于机器呢?我们是否也能使用重复的方式让它学习经验,最终形成稳定的学习结果?答案是肯定的。

    3、How Machine Learning?

     好,既然答案是肯定的,也许你不禁要问:为什么现在计算机还无法替代人脑?前面说了,人类大脑构造与反馈机制是学习基础,计算机的构造和人脑构造相差甚远(虽然现在已经有科学家在研究神经计算机,但离实用领域尚需实验与时间)。计算机的每个判断或计算结果需要经过无数个”是“、”否“的子判断来得到最终结果。对于某些计算机的判断来说甚至用的是最原始方式:将所以可能路径走一遍选择出来。而人可不是这样,对于稀松平常的事大脑已经对其可能性有了足够的经验支持。例如在超市看到了快过期的酸奶,有的人不介意,有的人则坚决不买。原因在于大家根据自己先前喝酸奶的经验以及听到的周围人喝了这样酸奶反应得出了自己的结论。如果是计算机来回答这个问题是什么思维?计算机需要找到一个样本,可能是一千、一万甚至更多,需要对样本分类:男的、女的、小孩、老人等等,根据之前的经验结果推出是该买还是不该买。

      有没发现,其实二者都是基于经验的发掘,人对于这个判断不会每次都去详细想这个结果怎么得来,而计算机需要知道确切的方式和步骤(事实上这个方式和步骤也是人类经过总结而告诉计算机的)。对于这些经验,人类无法直接告诉计算机,但是它可以识别数据,所以我们可以通过导入数据让机器通过一定的方法去发现数据背景或者这个数据模型背后的一些规律,从而进行评估、预测、推荐。这就是机器学习的工作基本原理。

下载前可以先看下教程 https://pan.quark.cn/s/a426667488ae 标题“仿淘宝jquery图片左右切换带数字”揭示了这是一个关于运用jQuery技术完成的图片轮播机制,其特色在于具备淘宝在线平台普遍存在的图片切换表现,并且在整个切换环节中会展示当前图片的序列号。 此类功能一般应用于电子商务平台的产品呈现环节,使用户可以便捷地查看多张商品的照片。 说明中的“NULL”表示未提供进一步的信息,但我们可以借助标题来揣摩若干核心的技术要点。 在构建此类功能时,开发者通常会借助以下技术手段:1. **jQuery库**:jQuery是一个应用广泛的JavaScript框架,它简化了HTML文档的遍历、事件管理、动画效果以及Ajax通信。 在此项目中,jQuery将负责处理用户的点击动作(实现左右切换),并且制造流畅的过渡效果。 2. **图片轮播扩展工具**:开发者或许会采用现成的jQuery扩展,例如Slick、Bootstrap Carousel或个性化的轮播函数,以达成图片切换的功能。 这些扩展能够辅助迅速构建功能完善的轮播模块。 3. **即时数字呈现**:展示当前图片的序列号,这需要通过JavaScript或jQuery来追踪并调整。 每当图片切换时,相应的数字也会同步更新。 4. **CSS美化**:为了达成淘宝图片切换的视觉效果,可能需要设计特定的CSS样式,涵盖图片的排列方式、过渡效果、点状指示器等。 CSS3的动画和过渡特性(如`transition`和`animation`)在此过程中扮演关键角色。 5. **事件监测**:运用jQuery的`.on()`方法来监测用户的操作,比如点击左右控制按钮或自动按时间间隔切换。 根据用户的交互,触发相应的函数来执行...
垃圾实例分割数据集 一、基础信息 • 数据集名称:垃圾实例分割数据集 • 图片数量: 训练集:7,000张图片 验证集:426张图片 测试集:644张图片 • 训练集:7,000张图片 • 验证集:426张图片 • 测试集:644张图片 • 分类类别: 垃圾(Sampah) • 垃圾(Sampah) • 标注格式:YOLO格式,包含实例分割的多边形点坐标,适用于实例分割任务。 • 数据格式:图片文件 二、适用场景 • 智能垃圾检测系统开发:数据集支持实例分割任务,帮助构建能够自动识别和分割图像中垃圾区域的AI模型,适用于智能清洁机器人、自动垃圾桶等应用。 • 环境监控与管理:集成到监控系统中,用于实时检测公共区域的垃圾堆积,辅助环境清洁和治理决策。 • 计算机视觉研究:支持实例分割算法的研究和优化,特别是在垃圾识别领域,促进AI在环保方面的创新。 • 教育与实践:可用于高校或培训机构的AI课程,作为实例分割技术的实践数据集,帮助学生理解计算机视觉应用。 三、数据集优势 • 精确的实例分割标注:每个垃圾实例都使用详细的多边形点进行标注,确保分割边界准确,提升模型训练效果。 • 数据多样性:包含多种垃圾物品实例,覆盖不同场景,增强模型的泛化能力和鲁棒性。 • 格式兼容性强:YOLO标注格式易于与主流深度学习框架集成,如YOLO系列、PyTorch等,方便研究人员和开发者使用。 • 实际应用价值:直接针对现实世界的垃圾管理需求,为自动化环保解决方案提供可靠数据支持,具有重要的社会意义。
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值