东木月
编程是为了更深刻的了解这个世界,或者作为自己的职业谋生存。 读书是为了让自己的灵魂得到升华,照亮自己的同时也指引他人。旅行见天地,读书明事理,工作合行知。
展开
-
获取数据做图书数据可视化平台
1、解析网站2、提取主要信息的xpath3、开线程爬取4、保存成csv文件原创 2025-03-08 17:41:35 · 43 阅读 · 0 评论 -
使用matplotlib绘制柱状图并在下面使用表格显示数值
1、数据准备2. 创建可视化布局3.、绘制柱状图4、创建表格5、设置字体大小、标题、图例6、显示图表原创 2025-02-23 17:08:47 · 70 阅读 · 0 评论 -
windows安装pytorch
windows安装pytorch原创 2025-02-20 20:32:47 · 223 阅读 · 0 评论 -
基于word2vec的文本大数据分析
基于word2vec的文本大数据分析1、获取数据2、预处理3、模型训练、保存4、模型预测5、模型评估6、模型优化原创 2025-01-05 23:05:04 · 312 阅读 · 0 评论 -
使用pandas把数据库中的数据转成csv文件
1、连接数据库,获取数据2、把一些中文字符转成gbk,忽略掉无法转化的3、把数据转成csv原创 2025-01-01 15:59:29 · 96 阅读 · 0 评论 -
六种特征标准化处理(特征归一化)方法【附python源码】
特征标准化处理(特征归一化)可以消除单位和尺度差异、适应算法要求、提高数据稳定性,还可以统一数据范围、加速算法收敛、提高模型性能等。原创 2024-12-09 21:35:19 · 94 阅读 · 0 评论 -
数据分析特征标准化方法及其Python实现
最小-最大值标准化Z分数标准化绝对值标准化中位数和四分位数间距(IQR)规范化器原创 2024-12-09 21:24:17 · 462 阅读 · 0 评论 -
数据分析常用的特征选择方法及其Python实现
特征重要性(分类器模型:xgboost、梯度提升、随机森林)卡方检验(统计学,逻辑斯蒂、向量机、贝叶斯)F-value值评估互信息递归特征消除斯皮尔曼秩相关系数原创 2024-12-07 23:48:52 · 462 阅读 · 0 评论 -
如何显示模型特征权重占比图【数据分析】
1、导入库2、加载数据集3、训练模型4、提取特征重要性5、绘制条形图原创 2024-11-09 15:57:52 · 417 阅读 · 0 评论 -
pyechart绘制特征平台均值与方差图
绘制特征平台均值与方差图1、获取每一种类型的特征2、求均值与方差3、使用Bar()柱形图实现堆叠4、方差图:最大值=均值+标准差,最小值=均值-标准差原创 2024-10-19 14:35:16 · 207 阅读 · 0 评论 -
numpy划分数组并获取每个子数组最大值
1、确定划分的步长n2、划分子数组,如果子数组不是n的整数倍,则截断3、重塑数组为二维,每行是一个子数组4、找到每行的最大值,转成列表5、获取列表的均值,标准差6、输出原创 2024-09-22 15:14:41 · 193 阅读 · 0 评论 -
数据分析训练模型后输出模型评估报告
数据分析训练模型后输出模型评估报告准确率、精确率、召回率、F1score概念、公式、代码原创 2024-09-08 12:19:21 · 490 阅读 · 0 评论 -
模型训练如何实现自动化输出评估报告、模型、特征平台
模型训练如何实现自动化输出评估报告、模型、特种平台1、设置模型初始准确率期望值与训练轮数2、多个分类器多线程训练3、获取特征并随机划分训练集与测试集4、保存模型、评估报告、特征与对应的训练数据主键(id)原创 2024-09-08 11:50:22 · 757 阅读 · 0 评论 -
python实现指数平滑法进行时间序列预测
1、指数平滑法是一种常用的时间序列预测算法,有一次、二次和三次平滑,通过加权系数来调整历史数据权重;2、主要思想是:预测值是以前观测值的加权和,且对不同的数据给予不同的权数,新数据给予较大的权数,旧数据给予较小的权数3、一次平滑适用于无明显趋势的数据;4、二次平滑用于修正线性趋势;5、三次平滑处理二次曲线趋势;6、加权系数a的大小影响预测的敏感性和平滑程度。原创 2024-08-22 22:17:19 · 506 阅读 · 0 评论 -
如何获取numpy数组中大于某个阈值的特定间隔的元素
如何获取numpy数组中大于某个阈值的特定间隔的元素原创 2024-08-04 21:52:10 · 95 阅读 · 0 评论 -
numpy如何按等长分割数组
1、分割数组2、转列表原创 2024-08-03 19:48:28 · 83 阅读 · 0 评论 -
如何使用numpy统计数组中每个值出现的次数
如何使用numpy统计数组中每个值出现的次数原创 2024-07-31 00:08:52 · 470 阅读 · 0 评论 -
如何使用numpy获取数组中出现次数最多的数值
1、使用unique函数获取每个元素的出现次数2、转成字典并按照值进行降序排序3、找出出现次数最多的数原创 2024-07-30 23:26:23 · 244 阅读 · 0 评论 -
如何在numpy数组中找到连续的数值、正数、负数、零
如何在numpy数组中找到连续的数值、正数、负数、零1、导入库 numpy2、获取对应的下标3、获取所有相邻元素差值不为1的值,并截取成子列表原创 2024-07-29 21:14:33 · 171 阅读 · 0 评论 -
numpy查找数组中小于阈值的最大连续子集
1、np.diff获取相邻元素的差值2、只要d_list的绝对值大于threshold,就可以添加一个split-point。3、使用np.flatnonzero,可以获得与np.split兼容的索引4、划分子集5、降序排列6、返回数组第一个元素原创 2024-07-23 14:29:00 · 233 阅读 · 0 评论 -
卷积神经网络图像识别车辆类型
卷积神经网络图像识别车辆类型1、获取数据,把图像转成矩阵,并随机划分训练集、测试集2、把标签转为数值,将标签向量转换为二值矩阵3、图像数据归一化,0-1之间的值4、构造卷积神经网络5、设置图像输入形状(32, 32, 3)6、设置卷积、池化层输出为三维矩阵7、三维平展为一维,输入全连接层8、输出层使用 softmax 激活函数,用于多分类问题9、初始化 RMSprop 优化器10、编译模型11、添加训练轮数早停止机制12、训练模型13、评估模型,显示评估指标图像14、预测原创 2024-07-14 13:13:47 · 501 阅读 · 0 评论 -
推荐算法的准确率、精准度、召回率、F1值
推荐算法的准确率、精准度、召回率、F1值原创 2024-05-18 17:40:15 · 821 阅读 · 0 评论 -
多种推荐算法综合比较评估指标
系统:图书用户协同推荐系统、网络小说推荐系统、旅游景点推荐系统、课程推荐系统、电影推荐系统算法:用户协同过滤、物品协同过滤、随机森林、图神经网络算法、关联规则推荐算法、kmeans-聚类、神经网络学习原创 2024-05-18 17:47:42 · 223 阅读 · 0 评论 -
使用tensorflow预测数据集回归曲线
使用tensorflow预测数据回归曲线1、读取数据2、输入层一个神经元,输出层一个神经元,中间 10 个3、设置第一层、第二层神经元4、构建损失函数5、训练6、画图原创 2024-04-16 14:33:46 · 213 阅读 · 0 评论 -
机器学习十大模型算法说明(附python实现代码)
机器学习十大模型算法说明(附python实现代码)k-means、knn、DBSCAN聚类、SVM向量机、逻辑斯蒂回归、贝叶斯、决策树、随机森林、神经网络、CNN卷积原创 2024-01-24 22:24:01 · 229 阅读 · 0 评论 -
python数据分析之交叉验证
有监督:SVM向量机、梯度提升、决策树(随机森林)、朴素贝叶斯、逻辑斯蒂回归、神经网络(cnn、rnn)无监督:k-means、隐马尔可夫原创 2024-01-03 23:05:05 · 540 阅读 · 0 评论 -
python使用隐马尔可夫模型识别波形数据MFCC特征
python使用隐马尔可夫模型识别振动波形数据MFCC特征1、由于HMM是无监督机器学习的生成模型,不需要标签2、为每个类别都构建HMM模型进行提取MFCC特征进行训练3、使用4作为components的数量,这正是HMM模型中隐藏状态的数量4、找出最佳状态数:测试不同值,并挑选优化预测的那个值5、存储每个类别训练后的模型6、对新数据进行预测时,调用所有模型,并进行评分,选择最高分对应模型类别作为预测值原创 2024-01-03 22:54:07 · 729 阅读 · 0 评论 -
numpy二维数组新增第一列值并删除最后一列
numpy二维数组新增第一列值并删除最后一列原创 2023-12-02 13:11:45 · 567 阅读 · 0 评论 -
k-means获取最佳k值:手肘法与轮廓系数法
k-means获取最佳k值:手肘法与轮廓系数法原创 2023-05-06 22:37:58 · 1733 阅读 · 0 评论 -
pandas读取MySQL数据
使用Pandas读取MySQL数据原创 2023-02-13 11:31:10 · 550 阅读 · 0 评论 -
python把二维列表转成一维列表
python把二维列表转成一维列表原创 2022-11-15 14:14:48 · 608 阅读 · 0 评论 -
python使用svm支持向量机对数据进行分类
python 使用svm支持向量机对数据进行分类原创 2022-10-30 17:40:40 · 645 阅读 · 0 评论 -
python波形峰值检测
python波形峰值检测原创 2022-10-29 14:37:58 · 4035 阅读 · 0 评论 -
numpy比较二维数组是否相等
numpy比较二维数组是否相等原创 2022-09-28 12:49:45 · 1194 阅读 · 0 评论 -
numpy对数组进行过滤并获取下标
numpy对数组进行过滤并获取下标原创 2022-09-17 17:07:43 · 506 阅读 · 0 评论 -
numpy获取二维数组某一行、某一列
numpy获取二维数组某一行、某一列原创 2022-07-15 10:02:56 · 6559 阅读 · 0 评论 -
python与matlab一些常用函数互转
python 与matlab一些常用函数互转原创 2022-06-09 15:57:06 · 478 阅读 · 0 评论 -
python计算多维向量空间夹角余弦值
向量空间夹角余弦值数学公式欧氏空间中定义了标准内积,就是对应分量相乘之和.这一点也和2,3维空间中内积定义的一样.那么向量a,b夹角的余弦为:cos=(ab的内积)/(|a||b|)即:a,b的内积除以它们的模的乘积等于二者夹角余弦。方式1:使用for循环来求解代码import mathdef cos_dist(a, b): ''' cos=(ab的内积)/(|a||b|) :param a: :param b: :return: '''原创 2022-03-22 09:46:31 · 3696 阅读 · 0 评论 -
python录制音频
python录制音频原创 2022-01-06 17:26:45 · 2511 阅读 · 0 评论 -
python使用openpyxl库创建读取Excel表格
使用openpyxl库读取和写入Excel表格1、导入openpyxl库pip install openpyxl2、创建xlsx文件import datetimefrom openpyxl import Workbookwb = Workbook()# 激活第一个sheet表格sheet = wb.activesheet['A1'] = 'hello world' # 在A1单元格写入字符串sheet['A2'] = datetime.datetime.now() # 在A2单元格直接原创 2021-10-11 17:57:41 · 1089 阅读 · 0 评论