一、机器学习概述

本文探讨了机器学习在多个领域的应用,包括模式识别、计算机视觉、数据挖掘、语音识别和自然语言处理。通过实例说明了如何使用算法识别新闻类别,并详细解释了从特征提取到算法训练的过程。同时,介绍了机器学习相关的科学计算库Numpy、数据分析库Pandas、数据可视化库Matplotlib以及机器学习库Scikit-learn。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

机器学习分类

  • 模式识别
  • 计算机视觉
    无人驾驶汽车 ,判断前方有没有车
  • 数据挖掘
    挖取有用的信息,比如游戏公司可以挖掘哪些用户会退坑
  • 语音识别
  • 统计学习
  • 自然语言处理

机器学习的具体干什么

举个例子,现在我想看个新闻,但是我想先知道这个新闻是体育类的还是非体育类的。就可以写个算法,让计算机去识别。
但在识别前需要给计算机提供足够的训练样本来告诉它什么才是体育类新闻,什么不是。在训练的途中需要一个人工的阶段,就是通过人对体育新闻和非体育新闻的理解来提取特征信息并告诉计算机,这一步至关重要。高端职业数据科学家就是从事这样的工作,他们强的地方不在于写代码,而是能在海量数据中发现特征信息。当特征抽取出来后,就要思考如何把这个信息告诉计算机,因为计算机只认识0和1,而人脑非常高级,所以最终要把文字信息转变为数字信息传达给计算机去学习,这就需要学习函数f(x)。具体来说,就是讲大量的数据样本以的方式投影到一个坐标系上,并在体育类和非体育类中寻找一条划分曲线,并求得这个曲线的函数,这个函数就是学习函数f(x)。如图:
在这里插入图片描述
完成后就是测试,用我们写好的算法对新的样本进行预测

机器学习相关知识

  • Numpy:科学计算库
    里面封装了许多科学计算的库,如矩阵。
  • Pandas : 数据分析库处理
    如缺失值怎么处理等操作的库
  • Matplotlib:数据可视化库
    进行画图操作,来帮助我们可视化数据
  • Scikit-learn:机器学习库
    里面封装了许多机器学习的算法
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值