通过简单示例来理解什么是机器学习

本文通过scikit-learn库探讨机器学习,包括加载数据、选择模型和预测应用。以iris数据集为例,展示了机器学习的三个基本步骤:数据获取、模型训练和预测。强调了模型选择和预测效果对机器学习的重要性。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

1 什么是机器学习

什么是机器学习?

这个问题不同的人员会有不同的理解。我个人觉得,用大白话来描述机器学习,就是让计算机能够通过一定方式的学习和训练,选择合适的模型,在遇到新输入的数据时,可以找出有用的信息,并预测潜在的需求。最终反映的结果就是,好像计算机或者其他设备跟人类一样具有智能化的特征,能够快速识别和选择有用的信息。

机器学习通常可以分为三个大的步骤,即 输入、整合、输出,可以用下图来表示大致的意思:

2 机器学习示例(scikit-learn)

在python语言中,scikit-learn是一个开源的机器学习库。下面以sklearn为例,来简单描述机器学习的过程。

2.1 加载数据

通常第一步是获取相关数据,并进行相应的处理,使之可以在后续过程中使用。

 
 
 
  1. from sklearn import datasets

  • 加载iris数据集并查看相关信息

 
 
 
  1. # 加载数据集

  2. iris = datasets.load_iris()

  3. # print(iris)

  4. print(type(iris))

  5. print(iris.keys())

  6. # 查看部分数据

  7. print(iris.data[ :5, :])

  8. # print(iris.data)

 
 
 
  1. <class 'sklearn.datasets.base.Bunch'>

  2. dict_keys(['DESCR', 'data', 'feature_names', 'target', 'target_names'])

  3. [[ 5.1  3.5  1.4  0.2]

  4. [ 4.9  3.   1.4  0.2]

  5. [ 4.7  3.2  1.3  0.2]

  6. [ 4.6  3.1  1.5  0.2]

  7. [ 5.   3.6  1.4  0.2]]

 
 
 
  1. # 查看数据维度大小

  2. print(iris.data.shape)

  3. # 数据属性

  4. print(iris.feature_names)

  5. # 特征名称

  6. print(iris.target_names)

  7. # 标签

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值