
机器学习
文章平均质量分 72
机器学习算法
花飞雨追
梦想不是浮躁,而是沉淀和积累。
展开
-
YOLOv3-YOLOv8的一些总结
这个文档主要总结YOLO系列的创新点,以YOLOv3为baseline。参考(抄)了不少博客,就自己看看吧。有些模型的trick不感兴趣就没写进来,核心的都写了。YOLO系列的网络都由四个部分组成:Input、Backbone、Neck、Prediction head。Input:主要是在训练开始之前进行resize、数据增强等操作,不同的YOLO在数据增强方面也有很多改进。在测试阶段则只会进行resize。原创 2023-12-15 16:37:55 · 1767 阅读 · 2 评论 -
强化学习(Reinforcement Learning)与策略梯度(Policy Gradient)
强化学习与Policy Gradient的介绍原创 2023-10-14 11:00:56 · 1179 阅读 · 1 评论 -
关于torch.nn.Linear的输入与输出探讨
关于torch.nn.Linear的一点问题 最近写Transformer代码的时候,FFN层是线性层,突然发现我丢进去的是一个三维的张量[batch_size, H, d_model],但是线性层nn.Linear竟然还给它算出来了,而且预期结果形状还是我想要的[batch_size, H, d_ff]。印象中nn.Linear的输入和输出都是二维的。于是我去找了一圈博客,各种博客里面写的都是输入二维的,更疑惑了。最后去看了官方文档才知道,他们都有问题。 输入和输出的维度可以是任意,而且输出的形原创 2021-05-27 17:19:28 · 18842 阅读 · 27 评论 -
手写数字识别——BP神经网络实现
手写数字识别——BP神经网络实现原创 2020-10-21 10:50:48 · 256 阅读 · 0 评论 -
speech separation
人类很神奇,在嘈杂的环境中,人类可以只专注于听其中一种声音,这就是鸡尾酒会效应。Speech Separation要做的事情就是,机器跟人一样,把它想要得到的声音从嘈杂的环境抽取出来。本文将讲述Speech Separation的算法。原创 2020-10-04 16:27:22 · 2836 阅读 · 2 评论 -
语音辨识的模型
LAS模型介绍原创 2020-08-11 03:35:48 · 1480 阅读 · 0 评论 -
语音识别
语音识别 声明:本文章只用于个人总结,视频链接为https://www.bilibili.com/video/BV1nE411K7Tm?p=2。原创 2020-08-11 03:30:14 · 532 阅读 · 0 评论 -
用于语言处理的深度学习
用于语言处理的深度学习原创 2020-08-11 03:23:18 · 209 阅读 · 0 评论