- 博客(47)
- 收藏
- 关注
原创 机器学习:支持向量机
支持向量机(SVM)是一种常用的分类算法,核心思想是通过寻找最优决策边界最大化分类间隔。主要分为硬间隔(完美线性可分)和软间隔(允许一定分类错误)两种形式。SVM通过核函数处理非线性问题,常用核函数包括线性核、多项式核和径向基核(RBF)。网格搜索可用于优化超参数选择。本文通过Python代码示例展示了SVM在分类和回归任务中的应用,包括数据准备、模型训练、评估指标计算和结果可视化。SVM在各类机器学习任务中表现优异,尤其适合处理中小规模数据集。
2025-10-13 17:24:52
693
原创 机器学习:决策树
决策树是一种基于树结构的分类模型,通过信息熵、信息增益、信息增益率和基尼系数等指标进行特征选择与数据划分。本文以天气数据为例,详细计算了信息熵(H(S)=0.940)、信息增益(天气特征增益最大为0.2467),并针对多值特征问题引入信息增益率(天气特征增益率0.156)。同时演示了基尼系数的计算(初始Gini=0.459),说明不同分裂准则的差异。通过Python代码实现了关键指标的计算,揭示了决策树构建过程中特征选择的核心逻辑,为分类问题提供量化依据。
2025-10-08 21:48:42
1158
2
原创 机器学习:逻辑回归
逻辑回归是一种用于分类的算法,通过sigmoid函数将线性回归结果映射为概率。它可处理二分类问题,也可通过多个分类器解决多分类任务。评估指标包括准确率、精确率、召回率、F1-Score、ROC曲线和AUC值等。实现方式上,既可用Sklearn的LogisticRegression模块,也可用PyTorch构建神经网络。其中PyTorch实现涉及定义网络结构、优化器和损失函数,训练后通过混淆矩阵和分类指标评估模型性能。两种方法都能有效完成分类任务,但PyTorch实现更灵活,适合复杂场景。
2025-10-03 14:18:26
1254
原创 机器学习:线性回归
本文介绍了线性回归的基本概念、实现方法及应用场景。主要内容包括:1) 线性回归适用于特征与目标值呈线性关系的情况,其"线性"指参数线性而非特征线性;2) 损失函数通常采用均方误差(MSE)衡量预测偏差;3) 优化方法主要有SGD随机梯度下降和Adam自适应学习率;4) 分别使用sklearn和PyTorch实现了一元线性回归,并通过可视化展示拟合效果;5) 介绍了多项式回归也属于线性回归,并演示了sklearn实现的三次多项式回归案例。文章通过代码示例展示了不同框架下的回归实现过程,对比
2025-09-30 20:55:27
981
原创 机器学习:编码方式
在对分类任务进行预测的时候,通常需要对目标类别进行编码(Encode),这里主要介绍在机器学习中常用的几种编码方式。包括:one-hot编码(独热编码)、标签编码、目标编码、序数编码。
2025-09-26 23:29:28
1207
原创 SQL:连续登录类型问题的解题思路
本文介绍了SQL中解决连续登录问题的两种方法:1)适用于短期连续登录的三表连接法,通过datediff筛选连续日期;2)适用于长期连续登录的窗口函数法,利用row_number()和日期差值计算连续天数。文中以新用户连续登录3天为例,展示了完整SQL实现过程,包括数据去重、注册用户筛选等步骤,并附有清晰的代码示例和结果截图。
2025-09-04 14:51:34
1226
原创 MySQL进阶篇(存储引擎、索引、视图、SQL性能优化、存储过程、触发器、锁)
MySQL进阶篇,基于前面的基础篇,本篇利用文字+代码+图片讲述了MySQL中存储引擎、索引、SQL性能优化、存储过程、触发器和锁的相关知识。
2025-05-29 21:57:44
1717
4
原创 MySQL入门篇(SQL语句、函数、约束、多表查询、事务)
本文章主要采用文字+代码+例题+运行结果的形式,讲解了MySQL中的基础知识,包括SQL语句(DDL、DML、DQL、DCL)、函数(数值函数、字符串函数、日期函数、流程函数)、约束(主要讲了主键和外键)、多表查询(内连接、外连接、子查询、联合查询)以及事务(事务特性、并发事务引起的问题以及隔离机制如何避免这些问题)。
2025-04-30 14:08:57
1096
1
原创 FPGA:UART串口接收(高干扰情况)
在上一篇文章中介绍过UART串口接收模块,其中一个需要优化的方向就是在高干扰情况下,如何实现可靠的UART串口接收任务。
2025-02-26 17:47:12
1534
1
原创 Tkinter-Entry单行输入组件
在GUI界面下,有时需要输入一些内容供我们接受,例如在一个登录界面,我们可能需要接受用户输入的账号、密码以及验证码等信息,这个时候可以考虑使用Entry单行输入组件。
2025-01-12 18:51:43
733
原创 Tkinter组件-Label标签组件
在GUI界面上,我们希望显示一些不可修改的内容,如在GUI界面下方写明版权、开发对应版本的信息。这个时候就需要使用Label标签。其不仅可以显示文字,也可以显示图像。
2025-01-12 18:37:42
776
原创 Tkinter组件-Button按键
在GUI图形界面中,用户需要有时候需要做一些确定的动作,例如播放视频,输入完账号密码后点击登录。这个时候需要就需要引入一个按钮(Button)供用户完成这个操作,在Tkinter内提供了Button方法,创建一个按钮。
2025-01-11 18:19:31
595
原创 初识Tkinter
GUI编程,全称为Graphical User Interface,即用户图形界面。我们使用Python进行编程时,通常在控制台显示程序的运行过程以及运行结果。使得其交互效果较差,由此,GUI编程可以解决这一“痛点”。目前,Python上提供的GUI编程库主要有以下三种:Tkinter,wxpython以及PyQt。
2025-01-10 14:15:50
326
原创 FPGA:串口通信发送模块
如何使用FPGA实现UART串口通信协议的发送模块呢?这里给出一种基于verilog的实现以及仿真测试,并给出误差分析的过程。
2024-08-02 14:06:53
1986
1
原创 FPGA:3-8译码器的设计
本文主要介绍了3-8译码器的基本工作原理以及真值表,并给出如何在FPGA开发板上可视化3-8译码器,并给出了对应的verilog格式的设计文件和测试文件。在结尾给出了仿真结果。
2024-07-18 00:22:40
2813
原创 Tensorboard的使用
使用Tensorboard中SummaryWriter类,并调用对应的add_image和add_scalar方法进行数据可视化。
2024-07-15 09:59:43
987
原创 数据挖掘——matplotlib
数据挖掘matplotlib部分,包括柱状图,折线图,直方图,饼图,散点图的绘画,并提供了具体的案例和对应代码,已经运行后的结果展示。
2024-07-09 20:12:07
1929
1
原创 机器学习——逻辑回归
逻辑回归是一个二分类算法,本文主要介绍了逻辑回归流程以及逻辑回归的损失评估,报考精确率和召回率,F1-score,ROC曲线和AUC指标,最后以癌症预测为案例并查看各种评估指标。
2024-07-06 14:48:42
2668
原创 机器学习——朴素贝叶斯算法
介绍了朴素贝叶斯与普通贝叶斯分类,并列举了如何计算贝叶斯概率以及分类流程,最后以垃圾短信分类为例,可发现朴素贝叶斯在文本处理能力出色。
2024-07-03 15:06:52
1356
原创 机器学习案例--使用KNN邻近算法预测Facebook用户签到位置
此时正确率较低,是因为筛选了经纬度固定的用户数据,但是我们在处理数据时还新增了一些数据,且过滤掉了次数少于3次的地点,最后,KNN是一个基于距离的算法,对线性关系处理较好。数据通常包括用户ID、签到时间、签到地点的经纬度、位置ID等。其中,row_id表示数据对应的id,在预测时无作用,x,y表示对应的经纬度,而accuracy表示测量进度,time表示时间戳(1970年1月1日起始),place_id为签到位置对应的id。:给定用户的签到记录,预测用户未来可能签到的地点(place_id)
2024-06-15 02:41:00
1187
癌症预测数据集,可用逻辑回归完成模型的构建
2024-07-06
波士顿房价数据集,包含四个特征
2024-07-05
朴素贝叶斯分类-短信数据集
2024-07-03
Facebook用户签到位置预测数据集
2024-06-15
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅