深度学习
文章平均质量分 65
行走的小骆驼
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
本地文件推送到GitHub上出错:Permission denied
本地文件推送到GitHub上出错:Permission denied原创 2024-10-23 20:20:23 · 950 阅读 · 0 评论 -
使用 argparse 模块解析命令行参数的完整示例
在机器学习和深度学习的项目中,通常需要通过命令行参数来配置训练、验证和测试的各种参数。我们将以一个文本分类任务为例,展示如何使用 argparse 模块定义和解析命令行参数,并在训练脚本中使用这些参数来配置模型的训练过程。• 调用 parser.parse_args() 解析命令行参数,返回一个包含所有参数的命名空间对象 config。parser.parse_args():解析命令行参数,返回一个包含参数的命名空间对象。• 通过命令行参数,可以在不修改代码的情况下,调整模型的训练、验证和测试参数。原创 2024-10-23 20:18:27 · 1337 阅读 · 0 评论 -
大模型面试题2
Transformer为何使用多头注意力机制?(为什么 不使用一个头)Transformer为什么Q和K使用不同的权重矩阵生 成,为何不能使用同一个值进行自身的点乘?Transformer计算attention的时候为何选择点乘而 不是加法?两者计算复杂度和效果上有什么区 别?为什么在进行softmax之前需要对attention进行 scaled(为什么除以dk的平方根),并使用公式 推导进行讲解在计算attention score的时候如何对padding做 mask操作?为什么在进行多头注意力的时候需原创 2024-09-01 15:52:44 · 489 阅读 · 0 评论 -
超参数和参数的区别
1分钟帮你弄清超参数和参数区别原创 2024-02-19 17:59:33 · 603 阅读 · 1 评论
分享