第一章机器学习基础

本文介绍了机器学习的基础概念,包括特征、目标变量等关键术语,详细解释了机器学习的主要任务如回归、分类、聚类和密度估计。同时,文章提供了选择合适算法的策略,并概述了开发机器学习应用的基本步骤。最后,探讨了Python在机器学习领域的优势及NumPy函数库的基础知识。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

1.1何为机器学习

将无序的信息转化成有序的可用的信息。

现实生活中许多无法建立精确的数学模型,需要基于统计学的工具进行求解。
1.2关键的术语

特征:可以是十进制的数字(身高,体重),二值型(0或1),自定义调色板的枚举类型(红,黄,篮),

目标变量:也被称为类别(在分类问题中),是机器学习的输出结果
1.3机器学习的任务

回归:预测数值型数据

分类:将实例数据划分到具体的分类中。

聚类:将数据集分成多组具有相似特征的类

密度估计:寻找描述数据统计工具值的过程
1.4如何选择合适的算法

1.确定使用机器学习算法的目的:分类?回归?聚类?

2.确定输入数据的特性:是否连续?是否异常?是否缺失?

3.永远不存在最好的算法,只能尽量减小选择的范围。
1.5开发机器学习应用的基本步骤

1.获得数据(爬虫或者公开的数据源)

2.确定数据的输入格式是否符合程序要求

3.确定数据是否完整并且没有异常

4.导入算法进行训练,获得训练后的机器学习算法

5.检验算法是否符合要求,足够令人满意

6.将该算法转换为程序
1.6python的优势

可以运行伪代码足够简介,开源的项目多学习和交流的氛围好,易于专注于实现思想
1.7NumPy函数库基础

NumPy是python的一个函数库,里面有矩阵和数组运算需要的函数。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值