自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(7)
  • 收藏
  • 关注

原创 词云的概述及实现方法

词云(WordCloud)也称为标签云或文字云,是文本数据可视化的艺术呈现方式,通过字体大小的差异展现关键词权重。

2025-03-15 18:48:57 794

原创 支持向量机(SVM)

支持向量机(SVM)是一种强大的监督学习算法,主要用于分类和回归任务。

2025-03-08 16:15:55 368

原创 梯度下降法

梯度下降法(Gradient Descent)是机器学习和深度学习中最重要的优化算法之一。它的核心思想是通过迭代调整参数,逐步逼近目标函数的最小值。

2025-03-07 17:37:31 1005

原创 特征工程——特征选择

递归特征消元法:需要给定一个预测模型(基模型),然后使用最初的特征进行模型预测到每一个特征的权值,然后丢弃权值最小的特征,重新训练模型。Embedded(嵌入法):它结合了过滤法和包装法,首先使用机器学习算法和模型训练,得到各个特征的权值,再根据系数大小选择特征。特征列一般不选数据大量缺失的、该列的数据类型为一个数组、自增的ID列、地址(或抽取该域名址,转换成有意义的特征值)、姓名。Filter(过滤法):使用给定的方差阈值对特征进行分类,保留方差过阈值的特征。特征选择是让有意义的特征输入模型进行训练。

2025-03-05 14:23:51 181

原创 特 征 工 程——数据预处理

sklearn.preprocessing个各类的作用类功能说明标准化,基于特征矩阵的列,将特征值转换至服从表正态分布区间缩放,基于最大值最小值,将特征值转换到[0,1]区间上Normalizer基于特征矩阵的行,将样本向量转换为单位向量Binarizer基于定阈值,将定量特征按阈值划分将定性数据编码为定量数据Imputer计算缺失值,缺失值可填充为均值等多项式数据转换使用单变元的函数来转换数据。

2025-03-03 15:54:28 875

原创 AI学习笔记

它具有各种分类、回归和聚类算法,包括支持向量机、随机森林、梯度提升、k均值和DBSCAN。缺点:不支持深度学习和强化学习,不支持Python以外的语言,对GPU的使用效率不高。人工智能(Artificial Intelligence)是利用计算机模拟人类智能行为科学的统称,它涵盖了训练计算机使其能够自主学习、判断、决策等人类行为的范畴。AI常用的开发框架包括scikit-learn、谷歌的TensorFlow、Facebook的Torch、微软的CNTK等。AI的驱动因素:算法、算力、数据。

2025-03-03 14:00:23 206

原创 计算机网络(第八版)复习——第一章 概述

计算机网络(简称为网络)由若干节点(node)和连接节点的链路(link)组成。互连网(internetwork或Internet)是“网络中的网络网络把许多计算机连接在一起,而互连网则是把许多网络通过路由器连接在一起。与网络相连的计算机常称为主机。1.2.2互联网基础结构发展的三个阶段(1)第一个阶段是从单个网络ARPANET像互联网发展的过程。ARPA开始研究多种网络(如分组无线电网络)互连技术,导致互连网络出现,成为现今互联网(Internet)的雏形。internet互连网。

2024-12-24 15:17:20 1016

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除