自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(47)
  • 收藏
  • 关注

原创 机器学习:支持向量机

支持向量机(SVM)是一种常用的分类算法,核心思想是通过寻找最优决策边界最大化分类间隔。主要分为硬间隔(完美线性可分)和软间隔(允许一定分类错误)两种形式。SVM通过核函数处理非线性问题,常用核函数包括线性核、多项式核和径向基核(RBF)。网格搜索可用于优化超参数选择。本文通过Python代码示例展示了SVM在分类和回归任务中的应用,包括数据准备、模型训练、评估指标计算和结果可视化。SVM在各类机器学习任务中表现优异,尤其适合处理中小规模数据集。

2025-10-13 17:24:52 693

原创 机器学习:决策树

决策树是一种基于树结构的分类模型,通过信息熵、信息增益、信息增益率和基尼系数等指标进行特征选择与数据划分。本文以天气数据为例,详细计算了信息熵(H(S)=0.940)、信息增益(天气特征增益最大为0.2467),并针对多值特征问题引入信息增益率(天气特征增益率0.156)。同时演示了基尼系数的计算(初始Gini=0.459),说明不同分裂准则的差异。通过Python代码实现了关键指标的计算,揭示了决策树构建过程中特征选择的核心逻辑,为分类问题提供量化依据。

2025-10-08 21:48:42 1158 2

原创 机器学习:逻辑回归

逻辑回归是一种用于分类的算法,通过sigmoid函数将线性回归结果映射为概率。它可处理二分类问题,也可通过多个分类器解决多分类任务。评估指标包括准确率、精确率、召回率、F1-Score、ROC曲线和AUC值等。实现方式上,既可用Sklearn的LogisticRegression模块,也可用PyTorch构建神经网络。其中PyTorch实现涉及定义网络结构、优化器和损失函数,训练后通过混淆矩阵和分类指标评估模型性能。两种方法都能有效完成分类任务,但PyTorch实现更灵活,适合复杂场景。

2025-10-03 14:18:26 1254

原创 机器学习:线性回归

本文介绍了线性回归的基本概念、实现方法及应用场景。主要内容包括:1) 线性回归适用于特征与目标值呈线性关系的情况,其"线性"指参数线性而非特征线性;2) 损失函数通常采用均方误差(MSE)衡量预测偏差;3) 优化方法主要有SGD随机梯度下降和Adam自适应学习率;4) 分别使用sklearn和PyTorch实现了一元线性回归,并通过可视化展示拟合效果;5) 介绍了多项式回归也属于线性回归,并演示了sklearn实现的三次多项式回归案例。文章通过代码示例展示了不同框架下的回归实现过程,对比

2025-09-30 20:55:27 981

原创 机器学习:编码方式

在对分类任务进行预测的时候,通常需要对目标类别进行编码(Encode),这里主要介绍在机器学习中常用的几种编码方式。包括:one-hot编码(独热编码)、标签编码、目标编码、序数编码。

2025-09-26 23:29:28 1207

原创 SQL:连续登录类型问题的解题思路

本文介绍了SQL中解决连续登录问题的两种方法:1)适用于短期连续登录的三表连接法,通过datediff筛选连续日期;2)适用于长期连续登录的窗口函数法,利用row_number()和日期差值计算连续天数。文中以新用户连续登录3天为例,展示了完整SQL实现过程,包括数据去重、注册用户筛选等步骤,并附有清晰的代码示例和结果截图。

2025-09-04 14:51:34 1226

原创 MySQL进阶篇(存储引擎、索引、视图、SQL性能优化、存储过程、触发器、锁)

MySQL进阶篇,基于前面的基础篇,本篇利用文字+代码+图片讲述了MySQL中存储引擎、索引、SQL性能优化、存储过程、触发器和锁的相关知识。

2025-05-29 21:57:44 1717 4

原创 每日登录新用户统计

每日登录的新用户数量统计

2025-05-24 17:50:10 498

原创 留存率问题

MySQL经典问题:留存率计算

2025-05-24 16:30:01 526

原创 Python四舍五入保留位数

Python四舍五入保留小数,round会去掉末尾的0

2025-05-22 00:38:18 204

原创 MySQL入门篇(SQL语句、函数、约束、多表查询、事务)

本文章主要采用文字+代码+例题+运行结果的形式,讲解了MySQL中的基础知识,包括SQL语句(DDL、DML、DQL、DCL)、函数(数值函数、字符串函数、日期函数、流程函数)、约束(主要讲了主键和外键)、多表查询(内连接、外连接、子查询、联合查询)以及事务(事务特性、并发事务引起的问题以及隔离机制如何避免这些问题)。

2025-04-30 14:08:57 1096 1

原创 FPGA:UART串口接收(高干扰情况)

在上一篇文章中介绍过UART串口接收模块,其中一个需要优化的方向就是在高干扰情况下,如何实现可靠的UART串口接收任务。

2025-02-26 17:47:12 1534 1

原创 FPGA:UART串口接收模块

FPGA串口接收模块。包含代码设计思想和优化思路。

2025-02-25 15:50:17 1594

原创 Tkinter-Entry单行输入组件

在GUI界面下,有时需要输入一些内容供我们接受,例如在一个登录界面,我们可能需要接受用户输入的账号、密码以及验证码等信息,这个时候可以考虑使用Entry单行输入组件。

2025-01-12 18:51:43 733

原创 Tkinter组件-Label标签组件

在GUI界面上,我们希望显示一些不可修改的内容,如在GUI界面下方写明版权、开发对应版本的信息。这个时候就需要使用Label标签。其不仅可以显示文字,也可以显示图像。

2025-01-12 18:37:42 776

原创 Tkinter组件-Button按键

在GUI图形界面中,用户需要有时候需要做一些确定的动作,例如播放视频,输入完账号密码后点击登录。这个时候需要就需要引入一个按钮(Button)供用户完成这个操作,在Tkinter内提供了Button方法,创建一个按钮。

2025-01-11 18:19:31 595

原创 Tkinkter程序类经典写法

GUI经典写法:使用Frame框架,将我们要定义的组件定义在一个类里面。

2025-01-11 18:11:05 365

原创 初识Tkinter

GUI编程,全称为Graphical User Interface,即用户图形界面。我们使用Python进行编程时,通常在控制台显示程序的运行过程以及运行结果。使得其交互效果较差,由此,GUI编程可以解决这一“痛点”。目前,Python上提供的GUI编程库主要有以下三种:Tkinter,wxpython以及PyQt。

2025-01-10 14:15:50 326

原创 FPGA:串口通信发送模块

如何使用FPGA实现UART串口通信协议的发送模块呢?这里给出一种基于verilog的实现以及仿真测试,并给出误差分析的过程。

2024-08-02 14:06:53 1986 1

原创 深度学习:Pytorch图像增强方法

深度学习Pytorch内提供的常用图片增强方法

2024-07-30 20:14:43 764

原创 FPGA:有限状态机

FPGA实现有限状态机,从6个小实验一步一步了解状态机之间各个变化的转换

2024-07-26 22:27:21 1231

原创 FPGA:流水灯设计

FPGA实现流水灯,主要介绍了三种方法实现流水灯,(1)位运算符;(2)循环位移;(3)使用3-8译码器

2024-07-26 22:24:19 1508 4

原创 FPGA:频闪灯设计

led灯一秒闪烁一次,即时序电路的设计。

2024-07-19 09:24:10 1504

原创 FPGA:3-8译码器的设计

本文主要介绍了3-8译码器的基本工作原理以及真值表,并给出如何在FPGA开发板上可视化3-8译码器,并给出了对应的verilog格式的设计文件和测试文件。在结尾给出了仿真结果。

2024-07-18 00:22:40 2813

原创 激活函数-activation function

激活函数,梯度爆炸和梯度消失以及解决对应问题的方案。

2024-07-17 16:22:07 1478

原创 FPGA:二选一选择器

FPGA开发二选一选择器

2024-07-16 15:51:28 1963

原创 Tensorboard的使用

使用Tensorboard中SummaryWriter类,并调用对应的add_image和add_scalar方法进行数据可视化。

2024-07-15 09:59:43 987

原创 Pytorch使用Dataset加载数据

深度学习中如何使用Pytorch读取数据?

2024-07-12 10:43:04 1369

原创 数据挖掘——matplotlib

数据挖掘matplotlib部分,包括柱状图,折线图,直方图,饼图,散点图的绘画,并提供了具体的案例和对应代码,已经运行后的结果展示。

2024-07-09 20:12:07 1929 1

原创 机器学习——无监督学习(k-means算法)

机器学习,无监督学习中的K-Means聚类算法,图解以及实例。

2024-07-06 19:10:32 1863

原创 机器学习——逻辑回归

逻辑回归是一个二分类算法,本文主要介绍了逻辑回归流程以及逻辑回归的损失评估,报考精确率和召回率,F1-score,ROC曲线和AUC指标,最后以癌症预测为案例并查看各种评估指标。

2024-07-06 14:48:42 2668

原创 机器学习——岭回归

岭回归(Ridge Regression)和线性回归(Linear Regression)都是用于回归分析的统计方法

2024-07-05 20:09:06 1480

原创 机器学习---线性回归

线性回归

2024-07-05 19:46:48 1088

原创 机器学习——随机森林

随机森林及其案例

2024-07-05 01:02:41 954

原创 决策树分类案例(鸢尾花分类)

使用决策树对鸢尾花进行分类,并进行可视化

2024-07-04 14:22:02 329

原创 机器学习——决策树及其可视化

决策树及其可视化,利用天气决定是否打网球为例,来进行训练,并输出可视化文件。

2024-07-03 16:38:52 942

原创 机器学习——朴素贝叶斯算法

介绍了朴素贝叶斯与普通贝叶斯分类,并列举了如何计算贝叶斯概率以及分类流程,最后以垃圾短信分类为例,可发现朴素贝叶斯在文本处理能力出色。

2024-07-03 15:06:52 1356

原创 机器学习案例--使用KNN邻近算法预测Facebook用户签到位置

此时正确率较低,是因为筛选了经纬度固定的用户数据,但是我们在处理数据时还新增了一些数据,且过滤掉了次数少于3次的地点,最后,KNN是一个基于距离的算法,对线性关系处理较好。数据通常包括用户ID、签到时间、签到地点的经纬度、位置ID等。其中,row_id表示数据对应的id,在预测时无作用,x,y表示对应的经纬度,而accuracy表示测量进度,time表示时间戳(1970年1月1日起始),place_id为签到位置对应的id。:给定用户的签到记录,预测用户未来可能签到的地点(place_id)

2024-06-15 02:41:00 1187

原创 KNN邻近算法&模型评估与调优(网格搜索和交叉验证)

模型评估与调优以及KNN邻近算法,根据最近的一个或者多个邻居判断自己的类型。

2024-06-11 15:43:38 1441

原创 特征降维&主成分分析

PCA主成分分析&特征降维。如何去除相关性较强的特征?

2024-06-10 20:25:56 898

癌症预测数据集,可用逻辑回归完成模型的构建

本数据集包含多个参数,CRIM,ZN,INDUS,CHAS,NX,RM,AGE,DIS,RAD,TAX,PTRATIO,B,LSTAT,MEDV 处理步骤: 1、读取数据 2、选取特征列和目标列 3、数据预处理——缺失值处理和数据归一化 4、预估器流程 5、模型评估与调优

2024-07-06

波士顿房价数据集,包含四个特征

RM: 每个住宅的平均房间数 LSTAT: 区域内房东的地位,表示低收入人群的百分比 PTRATIO: 区域内学生和教师的比例 MEDV: 自住房的中位数价值,以千美元为单位 可采用岭回归和线性回归进行预测

2024-07-05

朴素贝叶斯分类-短信数据集

短信分类数据集,含有10000条短信,text属性为短信的内容,label为短信的类别,有spam和ham两类,对应垃圾信息和正常信息。使用朴素贝叶斯可有效进行分类。具体流程参考主页朴素贝叶斯帖子。

2024-07-03

Facebook用户签到位置预测数据集

含有两个部分,测试集和训练集,测试集含有8607230条数据,训练集有29118021条数据,对应的属性分别如下:row_id表示数据对应的id,在预测时无作用,x,y表示对应的经纬度,而accuracy表示测量进度,time表示时间戳(1970年1月1日起始),place_id为签到位置对应的id。其对应的数据处理流程如下: 1、首先获取数据 2、数据处理(时间戳转化成对应的年月日,过滤掉签到次数少的地方,认为3次及以下为少) 3、筛选特征值目标值 4、数据集划分 5、预估器训练 6、模型评估与调优 我的博客内更新了使用KNN邻近算法的机器学习案例,并筛选了对应经纬度用户的数据作为训练集和测试集,从而进行预测。由于各个特征之间不存在线性关系,读者可以根据具体需求做对应的数据进行处理并且选用更为合适的算法进行处理,例如:随机森林、XGBoost或神经网络等等。

2024-06-15

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除