- 博客(3)
- 收藏
- 关注
原创 conda安装命令及应用
Conda是一个开源的、跨平台的软件包管理和环境管理工具,可以简化软件包和依赖项的管理和部署过程,并支持多种语言,包括Python、R、Ruby、Lua、Scala、Java、JavaScript、C/C++和FORTRAN等。鸢尾花数据集是一个常用的多类分类数据集,包含了150个样本,每个样本有4个特征(花萼长度、花萼宽度、花瓣长度、花瓣宽度),以及一个标签(鸢尾花的种类,包括setosa、versicolour、virginica三种)。
2024-04-25 08:26:34
609
2
原创 KNN算法
然而,KNN算法的缺点主要是计算复杂度高,当数据集很大时,计算距离的时间和空间开销都会很大,影响算法执行效率。在KNN算法中,K值的选择是一个重要的参数。如果K值很小,可能会受到异常点的影响,如果K值很大,可能会使得模型变得简单,决策边界变平滑,出现欠拟合的情况。该算法的核心思想是,如果一个样本在特征空间中的K个最相邻的样本中的大多数属于某一个类别,则该样本也属于这个类别。曼哈顿距离是计算两点在一个网格上的路径距离,与上述的直线距离不同,它只允许沿着网格的水平和垂直方向移动。
2024-04-23 18:29:23
399
原创 实习打卡day1
随着大数据时代的到来,机器学习已经成为我们生活中不可或缺的一部分。无论是语音识别、图像识别,还是自然语言处理,机器学习都为我们带来了前所未有的便利和效率。今天,我将带领大家踏上一段机器学习的旅程,一起探索其原理、应用与实践。
2024-04-22 23:08:02
608
1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人