自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(9)
  • 收藏
  • 关注

原创 Bert实战

total_num = sum(p.numel() for p in model.parameters()) # 统计模型所有参数的总数trainable_num = sum(p.numel() for p in model.parameters() if p.requires_grad) # 统计可训练参数数量p.numel():返回单个参数张量的元素个数(即参数数量)。该函数返回一个字典,包含模型总参数量和可训练参数量(默认加载的预训练 BERT 所有参数都可训练)。

2026-01-06 20:58:56 929

原创 第七章:自注意力机制 self-attention

每个词对于一个编码。

2026-01-04 14:54:55 185

原创 第六章:深度学习与特征(无监督学习)

图片输入经过不同模型得到输出。

2026-01-03 19:33:53 114

原创 第五章:如何处理分类任务(预习)

我们一般的模型都是通过数据和标签(真实值)算出loss计算梯度。

2026-01-03 16:20:39 148

原创 线性回归项目(新冠病毒预测)

Scikit-learn 库,它们在机器学习流程中扮演着至关重要的角色:数据预处理和特征工程。特征选择1.SELECTKBEST(选择 “最好” 的 K 个特征)例:一个特征是 “年龄”(范围在 0-100),另一个特征是 “年收入”(范围在 0-1,000,000)。在计算距离或梯度时,“年收入” 这个特征的巨大数值会完全主导计算过程,使得 “年龄” 这个特征的影响被忽略作用: 的用途:卡方检验(Chi-Squared Test),是一个常用的评分函数。当特征数量非常多时,模型训练会变慢,并

2025-12-30 16:48:37 872

原创 第四章:卷积的问世

它的作用是将矩阵从A维度转为B维度。比如输入有4个变量,回归任务,需要输出1个值。就使用:一个(164)的矩阵经过会转为(161中间多算几次,可以加深网络加强效果。如使用梯度下降算法,计算loss梯度回传图一是回归,图二是分类使用onehot独热编码行为特征值一列的来区别类别,通过列矩阵那一个特征值最大图片本质是是一个矩阵。

2025-12-29 20:44:10 702

原创 线性回归实战

模型改善的过程。

2025-12-27 22:10:41 106

原创 简易神经网络

定义数据量num=500,true_w=torch.tensor表示将[8.1,2,2,4]这四个特征值张量化true_b=torch.tensor(1.1)将偏置值张量化num = 500##创建线性关系plt画散点图plt.scatter(X[:, 3], Y, 1)##散点图,x,y必须是相同的大小(:表示取全部行,3表示取第三列)plt.show()生成器函数。

2025-12-27 13:48:49 748

原创 1.机器学习

人工智能,能够感知,推理,行动的程序,规则。深度学习,利用多层神经网络从大量数据中学习。机器学习,随着数据量的增加不断改进性能。人工智能(机器学习((深度学习))

2025-12-25 11:36:35 116

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除