- 博客(14)
- 收藏
- 关注
原创 PyTorch介绍
PyTorch 是由开发的,以动态计算图、Python 优先设计和强大的 GPU 加速著称。它已成为学术界和工业界的主流工具,尤其在研究领域占据主导地位(据 PapersWithCode 统计,超过 70% 的顶会论文使用 PyTorch)。
2025-06-18 00:30:00
1660
原创 深度学习介绍
深度学习正在从“感知智能”迈向“认知智能”,其与强化学习、图神经网络的融合将开启下一代AI系统。(通常含多个隐藏层),在计算机视觉、自然语言处理等领域实现了突破性进展。跨界应用(CV领域的Vision Transformer、音频处理)深度学习(Deep Learning)是机器学习的子领域,通过。:训练大模型耗能巨大(如GPT-3训练费用约460万美元)利用数据自身构造监督信号(如BERT的掩码语言建模):依赖大规模标注数据(弱/无监督学习是突破口):微小扰动可误导模型(安全攸关场景的隐患)
2025-06-17 20:01:09
631
原创 深度学习之卷积神经网络CNN
卷积层:核心操作:卷积。 这是 CNN 得名的关键操作。目的: 从输入数据中提取局部特征(如边缘、纹理、颜色模式、更复杂的形状等)。工作原理:定义一个小的、可学习的矩阵,称为卷积核或滤波器。将这个核在输入数据(如图像)上按照一定的步长滑动。在每个滑动位置,核与输入数据覆盖的局部区域进行逐元素相乘,然后将所有乘积结果求和,得到一个输出值。滑动覆盖整个输入后,得到一个二维的特征图,称为激活图或特征图。关键特性:局部连接: 输出中的每个神经元只与输入数据的一个小局部区域(感受野)连接,而不是全连接。这大大减少了参
2025-06-17 15:18:02
933
原创 机器学习之聚类Kmeans算法
无监督学习(无需标签):将数据集划分为 KK 个互斥子集(簇),使:最小化簇内样本到质心(Centroid)的平方距离和数据集预设簇数 KK最大迭代次数或收敛阈值 ϵKK 个簇质心集合。
2025-06-03 21:07:19
1627
原创 机器学习之集成学习
优点:通常能显著超越单一最佳模型。对噪声、异常值和数据扰动更不敏感(尤其Bagging/RF)。Bagging/RF有效降低方差;Boosting通过早停也可控制。Boosting有效降低偏差。能捕捉数据中更复杂的模式和关系。基于树的方法天然支持。缺点:包含多个模型,训练和预测计算成本更高、更耗时。相对于单一模型(如线性回归、决策树),理解集成模型(尤其是Stacking、深度Boosting)的内部决策逻辑非常困难(“黑盒”特性更强)。
2025-06-03 12:45:00
2273
原创 机器学习之决策树
(Reduced Error Pruning):用验证集评估剪枝效果。(Cost Complexity Pruning):平衡误差与复杂度。:基于特征对样本进行递归划分,最终形成一棵树形决策模型。⚠️ 缺点:倾向选择取值多的特征(易过拟合):特征测试条件(如“年龄≤30?熵值范围:[0,1],值越大越混乱。:特征测试结果(“是”或“否”):最终决策结果(类别/数值):第i类样本在集合D中的比例。IV(A):特征A的固有值。:特征A取值为u的子集。:子区域输出值(均值):区域内样本的目标均值。
2025-06-02 20:33:43
649
原创 机器学习之线性回归
其中:y:因变量(目标变量)X₁, X₂,..., Xₙ:自变量(特征)β₀:截距项(偏置)β₁, β₂,..., βₙ:回归系数(权重)ε:误差项(随机扰动)
2025-05-29 11:00:00
493
原创 机器学习之KNN算法
根据这K个邻居的类别(分类问题)或值(回归问题),通过投票或平均的方式确定待分类样本的类别或值。特征标准化:由于KNN基于距离计算,不同特征的量纲会影响结果,通常需要进行标准化处理。加权投票:根据距离远近赋予不同权重(如距离越近权重越大):如何计算样本之间的距离(如欧氏距离、曼哈顿距离等):如何根据邻居决定样本类别(如多数表决、加权投票等)给较近的邻居分配更大的权重,如1/d或exp(-d)(当p=1时为曼哈顿距离,p=2时为欧氏距离)K值太大:模型简单,可能欠拟合,忽略局部特征。
2025-05-28 14:58:18
696
原创 Pandans基础学习
Pandas是Python的数据分析核心库,核心数据结构:Series - 带标签的一维数组(类似Excel列 DataFrame - 二维表格(类似Excel工作表) 二、数据读取与保存支持多种文件格式:三、数据查看与筛选1.查看数据: 2.数据筛选:四、数据处理1,缺失值处理:2,数据排序:五、数据分组与聚合六、合并数据七、时间序列处理八、透视表核心功能1.基础语法2.多维分析支持多层
2025-05-27 20:22:22
208
原创 Numpy基础学习
多维数组对象 (ndarray)高效存储和操作同质数据(所有元素类型相同)支持向量化操作,避免显式循环广播功能允许不同形状的数组进行数学运算丰富的数学函数库线性代数、傅里叶变换、随机数生成等集成 C/C++/Fortran 代码的工具便于与底层语言交互性能优化底层用 C 实现,运算速度快比纯 Python 代码快几个数量级2.数组属性3.数组索引和切片4.数组操作形状操作数学运算统计运算5.常用函数6.数组拼接和分割由于nump
2025-05-16 19:54:19
227
原创 MySQL基本命令操作与语法书写规范
SQL关键字使用大写(如SELECT, FROM, WHERE)标识符(如表名、列名)可以使用反引号(``)避免冲突。表名和列名使用小写和下划线(user_info)避免使用MySQL保留字作为标识符。字符串使用单引号('value'):复杂查询使用缩进提高可读性。:每条SQL语句以分号结束。
2025-05-14 14:44:45
306
原创 python基础重点
f=open('文件路径','对文件的操作方式',encoding='utf-8'(文件编码格式))随机函数:引入 import random ,使用randon.randint(x,y)序列的切片:切片[开始索引:结束索引:步长](结束索引=结束位置-1)函数概念:提前写好的,可以重复使用的,具有特定功能的代码块。f.close()关闭文件(必须结合open使用)上述怎么执行都会执行的代码。输入输出:print(),input()容器一般配合range(x,y,z)使用。return 返回值。
2025-04-29 20:15:41
239
1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人