qq_21605931-优快云博客

原创 Bert实战

total_num = sum(p.numel() for p in model.parameters()) # 统计模型所有参数的总数trainable_num = sum(p.numel() for p in model.parameters() if p.requires_grad) # 统计可训练参数数量p.numel()：返回单个参数张量的元素个数（即参数数量）。该函数返回一个字典，包含模型总参数量和可训练参数量（默认加载的预训练 BERT 所有参数都可训练）。

2026-01-06 20:58:56 929

原创第七章：自注意力机制 self-attention

每个词对于一个编码。

2026-01-04 14:54:55 185

原创第六章：深度学习与特征(无监督学习)

图片输入经过不同模型得到输出。

2026-01-03 19:33:53 114

原创第五章：如何处理分类任务（预习）

我们一般的模型都是通过数据和标签（真实值）算出loss计算梯度。

2026-01-03 16:20:39 148

原创线性回归项目（新冠病毒预测)

Scikit-learn 库，它们在机器学习流程中扮演着至关重要的角色：数据预处理和特征工程。特征选择1.SELECTKBEST（选择 “最好” 的 K 个特征）例：一个特征是 “年龄”（范围在 0-100），另一个特征是 “年收入”（范围在 0-1,000,000）。在计算距离或梯度时，“年收入” 这个特征的巨大数值会完全主导计算过程，使得 “年龄” 这个特征的影响被忽略作用: 的用途：卡方检验（Chi-Squared Test），是一个常用的评分函数。当特征数量非常多时，模型训练会变慢，并

2025-12-30 16:48:37 872

原创第四章：卷积的问世

它的作用是将矩阵从A维度转为B维度。比如输入有4个变量，回归任务，需要输出1个值。就使用：一个（164）的矩阵经过会转为（161中间多算几次，可以加深网络加强效果。如使用梯度下降算法，计算loss梯度回传图一是回归，图二是分类使用onehot独热编码行为特征值一列的来区别类别，通过列矩阵那一个特征值最大图片本质是是一个矩阵。

2025-12-29 20:44:10 702

原创线性回归实战

模型改善的过程。

2025-12-27 22:10:41 106

原创简易神经网络

定义数据量num=500，true_w=torch.tensor表示将[8.1,2,2,4]这四个特征值张量化true_b=torch.tensor(1.1)将偏置值张量化num = 500##创建线性关系plt画散点图plt.scatter(X[:, 3], Y, 1)##散点图,x,y必须是相同的大小(：表示取全部行，3表示取第三列)plt.show()生成器函数。

2025-12-27 13:48:49 748

原创 1.机器学习

人工智能，能够感知，推理，行动的程序，规则。深度学习，利用多层神经网络从大量数据中学习。机器学习，随着数据量的增加不断改进性能。人工智能（机器学习（（深度学习））

2025-12-25 11:36:35 116

qq_21605931的博客