scikit-learn 实战之非监督学习

本文介绍了非监督学习的概念,并通过scikit-learn库详细阐述了K-Means聚类算法的原理和步骤。通过一个实例展示了如何使用K-Means进行数据聚类,帮助理解非监督学习在实际问题中的应用。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

scikit-learn 实战之非监督学习

一、实验介绍

1.1 实验内容

非监督学习(英语:Unsupervised learning)是机器学习中十分重要的一个分支。这是实验课程的第一章节,将带你了解什么是非监督学习?并学会用 K-Means 算法完成一个聚类实验。

1.2 实验知识点

  • 非监督学习概念
  • K-Means 聚类

1.3 实验环境

  • python2.7
  • Xfce 终端
  • ipython 终端

1.4 数据与代码获取

你可以通过下面命令下载代码与数据,作为参照对比进行学习。

$ wget http://labfile.oss.aliyuncs.com/courses/880/k_means_cluster.py
$ wget http://labfile.oss.aliyuncs.com/courses/880/cluster_data.csv

二、什么是非监督学习?

什么是非监督学习?笼统来讲,它和监督学习是一个相对的概念。在监督学习的过程中,我们需要对训练数据打上标签,这是必不可少的一步。而非监督学习中,就不再不需要提前对数据进行人工标记。

举个例子,比如我们现在有一堆动物的照片。在监督学习中,我们需要提前对每张照片代表的动物进行标记。这一张是狗,那一张是猫,然后再进行训练。最后,模型对于新输入的照片,就能分清楚动物的类别。

当进行非监督学习时,就不需要提前对照片进行标记了。我们只需要将所有的训练样本照片「喂」给算法即可。注意,这个时候和监督学习有一些不同,非监督学习只能识别出训练样本里包含了几种类别的动物,而并不能直接告诉你这只是猫,那一只是狗。但是,这里的类别数量一般都不会太大,你可以手动对类别进行

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值