- 博客(6)
- 收藏
- 关注
原创 博客摘录「 深度学习中Transformer的注意力机制底层实现原理(超详细)」2024年11月4日
左侧编码器:将输入的句子进行分词后进行词嵌入,同时将每个词的位置信息编码加入,进行自注意力分配,生成Q、K、V,再通过多头注意力机制得到新的结果,将新的结果和原有的结果相加再进行归一化,通过全连接生成新的结果,生成的新的结果和前面归一化后的结果再次相加进行归一化。这个结果作为下次输入的数据。这个过程执行N次,即图中菜单N+。将执行N次的结果最终生成K和V传给右侧的界面器使用。
2024-11-05 08:48:09
748
原创 【已解决】MySQL workbench导入含中文的csv文件报错问题
在excel导出csv文件之前,将所有的英文逗号”,“替换成中文逗号“,”然后重复上述1-3的解决步骤即可导入成功。
2024-06-28 17:00:50
1820
3
转载 python模块组成与命名规范
一、在实际的工程项目中,Python由以下4个文件模块组成1、顶层的包(类似文件夹)2、各个模块(Python file)3、类(class 定义类;面向对象【工程中必用,初学者可不用】)4、变量和方法(函数)。其中,方法中也可以定义变量(方法中的变量)。二、命名规范:包:使用小写字母命名。多个单词之间用下划线分隔。e.g. count_fault_types_num.py模块:使用小写字母命名。多个单词之间用下划线分隔。类(驼峰命名法):使用小写字母命名但是首字母大写。
2024-03-12 11:55:27
160
1
转载 Pycharm快捷键
1. file -> Setting -> General -> Synchronization -> Save files on frame deactivation 和 Save files automatically if application is idle for .. sec 的勾去掉。4. Pycharm中默认是不能用Ctrl+滚轮改变字体大小的,可以在file -> Setting ->Editor-〉Mouse中设置。Ctrl + Shift + U 在选定的区域或代码块间切换。
2023-08-28 23:55:42
101
原创 吴恩达机器学习作业python实现 (一)多元线性回归
训练数据集包含三个具有四个特征(大小、卧室、楼层和年龄),如下表所示。使用这些值构建一个线性回归模型,以便预测其他房屋的价格。
2023-04-05 14:25:34
709
1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人