- 博客(168)
- 资源 (3)
- 收藏
- 关注

原创 CS资源收集
本文的内容旨在收集互联网上优质的学习资源!1. 清华大学计算机系课程攻略:https://github.com/PKUanonym/REKCARC-TSC-UHT2. 浙江大学课程攻略共享计划:https://github.com/QSCTech/zju-icicles3. 网易云课堂大学计算机课程:大学计算机专业 - 网易云课堂4.计算机导论:Harvard CS50CS50: Introduction to Computer Science Berkeley CS61ACS .
2022-04-09 12:41:24
3580
原创 50 个适合所有人的 2024 款最佳 Ubuntu 应用程序
Ubuntu 是一种流行的 Linux 发行版,它为各种用途提供了广泛的应用程序。Ubuntu 及其默认桌面产品 GNOME 使您能够为各种目的试用许多应用程序。无论您是学生、专业人士还是临时用户,Ubuntu 生态系统中都有适合您的应用程序。在本文中,我们将探讨一些可以提高您的工作效率、创造力和整体用户体验的最佳 Ubuntu 应用程序。其中一些是显而易见的,而一些对您来说可能是新的。
2024-09-14 09:44:13
5705
原创 Llama 3.1论文中文对照翻译
现代人工智能(AI)系统由基础模型驱动。本文介绍了一组新的基础模型,称为 Llama 3。它是一群原生支持多语言、编码、推理和工具使用的语言模型。我们最大的模型是一个密集型 Transformer,具有 405B405B 参数和高达 128K128K 个令牌的上下文窗口。本文对 Llama 3 进行了广泛的实证评估。我们发现 Llama 3 在众多任务上与 GPT-4 等领先语言模型相比质量相当。我们公开发布了 Llama 3,包括 405B 参数语言模型的预训练和后训练版本以及用于输入和输出安
2024-08-09 09:05:09
2621
原创 ubuntu20.04安装cuda11.8 + cuDNNv8.9.0 (July 11th, 2023), forCUDA 11.x+TensorRT-8.6.1+protobuf-3.194
ubuntu20.04 安装 cuda11.8 + cuDNN v8.9.0 (July 11th, 2023), for CUDA 11.x + TensorRT-8.6.1
2023-08-11 21:22:11
5055
原创 ubuntu20.04 opencv4.2 安装笔记
ubuntu20.04 opencv4.2 opencv_contrib-4.2.0 安装
2023-08-11 21:17:19
1205
原创 【水下图像增强】Enhancing Underwater Imagery using Generative Adversarial Networks
自动水下航行器(Autonomous underwater vehicles (AUVs))依靠各种传感器——声学、惯性和视觉(acoustic, inertial and visual)——进行智能决策。由于其 非侵入性、被动性和高信息量,视觉(non-intrusive, passive nature, and high information content) 是一种有吸引力的传感方式,特别是在较浅的深度。
2023-03-05 21:18:50
3905
原创 【论文阅读】SCRFD: Sample and Computation 重分配的高效人脸检测
尽管在 非受控(uncontrolled)人脸检测 方面已经取得了巨大的进展,但低计算成本和高精度的 高效人脸检测仍然是一个公开的挑战。本文指出训练数据采样和计算分布策略(training data sampling and computation distribution strategies)是高效准确的人脸检测的关键。
2023-02-21 17:47:47
1422
4
原创 【论文阅读】SSR-Net: 一个小型的 软分段回归网络 用于年龄估计
本文提出了一种新的 CNN 模型,称为 Soft Stagewise Regression Network (SSR-Net),使用从小型模型对单个图像进行年龄估计。受 DEX 的启发,我们通过执行多类分类来解决年龄估计问题,然后通过计算期望值将分类结果转化为回归。SSR-Net 采用由粗到细的策略并执行 多阶段的多类分类。每个阶段只负责完善其前一阶段的决策,以获得更准确的年龄估计。因此,每个阶段执行的任务很少,需要的神经元也很少,从而大大减少了模型的大小。
2023-02-21 12:49:15
1294
1
原创 卡尔曼滤波之基本概念和状态观测器
Kalman Filters 是一种优化估计算法。下面使用使用两个例子说明 Kalman Filters 的用处。例子1:用来说明: 在系统的状态无法直接被测量时候, Kalman Filters 如何来估算系统状态。对于飞船的燃烧室,需要监控燃烧室的温度,但是内部温度太高会烧坏传感器,因此只能测量外部温度,那么如何根据测量的外部温度,估计内部问题呢?可以使用 Kalman Filters 利用间接的
2022-12-04 21:16:46
1444
2
原创 机器学习分类模型评价指标之ROC 曲线、 ROC 的 AUC 、 ROI 和 KS
ROC曲线是由 FPR 与 TPR 构成的曲线。该曲线最早应用于雷达信号检测领域,用于区分信号与噪声。后来人们将其用于评价模型的预测能力。与 P-R 曲线类似,通过设定不同的模型参数,模型的预测结果会对应不同 TPR 与 FPR。将不同的(FPR,TPR)构成的点绘制成曲线,就得到了 ROC 曲线。
2022-11-22 12:18:27
4263
原创 机器学习分类模型评价指标之Accuracy、Precision、Recall、F-Score、P-R Curve、AUC、AP 和 mAP
本文旨在说明其他机器学习模型的评价指标。
2022-11-21 01:31:22
8258
原创 机器学习分类模型评价指标之混淆矩阵
在机器学习领域,特别是在统计分类的问题中,混淆矩阵,也被称为 错误矩阵,是一种独特的表排列,可以可视化一个算法的性能,通常是监督学习(在非监督学习中,它通常被称为 匹配矩阵)。矩阵的每一行代表一个实际类中的实例,而每一列代表一个预测类中的实例,-这两种变体都可以在文献[11]中找到。这个名字源于这样一个事实,即它很容易看出系统是否混淆了两个类(即通常将一个类错误标记为另一个类)。看来行是真实或者预测都是可以的。
2022-11-18 12:43:28
3783
1
原创 【新技术】语音到语音翻译 Speech-to-speech translation for a real-world unwritten language
还有许多工作可以做。这可能是自监督学习在语音领域应用的开端。像情感、说话人对应等等有待探索。开始卷向 语音领域了。很新颖的观点,未来可期。
2022-11-10 11:53:31
1107
原创 【目标检测】YOLOv6: A Single-Stage Object Detection Framework for Industrial Applications 论文翻译
多年来,YOLO系列一直是高效物体检测的事实上的工业级标准。YOLO社区以压倒性的优势丰富了它在众多硬件平台和丰富场景中的应用。在这份技术报告中,我们努力把它的极限推到一个新的水平,以坚定不移的心态向工业应用迈进。考虑到现实环境中对速度和 accuracy 的不同要求,我们广泛地研究了来自工业界或学术界的最新的物体检测进展。具体来说,我们大量吸收了最近的网络设计、训练策略、测试技术、量化和优化方法的思想。在此基础上,我们整合了我们的想法和实践,建立了一套不同规模的 可部署(
2022-10-31 14:04:38
976
原创 YOLOv7 开启 --image-weights DDP 训练时候遇到的错误:RuntimeError: Tensors must be CUDA and dense
YOLOv5 作者说两者不兼容,他在新的代码中添加了一个提示。不开启 --image-weights 参数。
2022-10-24 00:05:57
4052
2
原创 labelimg 修正模型错误标注遇到的问题
使用了 模型(如YOLOv5/v7) detec.py 保存的 YOLO 格式的结果,包括测试的图像和对应的 txt 文件。模型跑出来的结果可能不够准确,需要手工修正下,因此我需要使用 labelimg 来可视化图像,并且修改其标注信息。
2022-10-21 12:10:09
5410
3
原创 YOLOv5/v7 中的类别不平衡问题解决方案研究
本文定义的类别不平衡问题:在图像分类问题中,不同类别的图像的个数不同,并且差异较大。在目标检测问题中,目标类别的个数区别较大。这都是类别不平衡问题。原理:当训练图像的所有时, 我们可以更改, 即而达到更改的目的。然后根据 图像权重 重新采集数据,这在图像类别不均衡的数据下尤其重要。使用 YOLOv5/v7 训练自己的数据集时,各类别的标签数量难免存在不平衡的问题,在训练过程中为了就减小类别不平衡问题的影响,YOLOv5/v7 中引入了和的设置。
2022-10-18 13:59:52
2844
2
原创 YOLOX 学习笔记
YOLO 系列高性能:速度快,精度高,方便部署(工业界)。YOLO系列发展至今主要包含了v1、v2、v3、v4和v5以及针对每个版本的改进系列。YOLOv1源于Joseph Redmon,主要贡献在于:开发出实时高性能目标检测的one-stage检测框架,只需要将图像一次性输入到网络中即可预测出图像中目标的位置,具有速度快;检测精度高和方便部署等优点。
2022-10-15 19:33:09
4150
原创 目标检测标签分配之 OTA 和 SimOTA 细节学习
一张图片上有3个目标框,即3个ground truth项目有2个检测类别,比如 cat/dog网络输出1000个预测框,其中只有少部分是正样本,绝大多数是负样本是候选检测框的信息,维度是[1000,4]。预测框的四个坐标。obj_preds是目标分数(object score),维度是[1000,1]。预测框是前景还是背景。cls_preds是类别分数,维度是[1000,2]。预测框的2个检测类别的one-hot。训练网络需要知道这 1000个预测框的标签,而如何分配标签呢?
2022-10-12 10:59:28
4975
1
原创 Retinaface ONNX 如何正确导出
Retinaface 是一个人脸检测器,人脸检测天生存在强先验知识,比如近场人脸识别,人脸较大,监控视角下人脸识别通常人脸较小,两者天生对输入的分辨率有个假设,如果人脸很大,不需要大的分辨率,提升速度。人脸小,希望提高 Recall 那么需要大的分辨率。Retinaface 在不同分辨率下怎么做这件事情。怎么通过 这个仓库的方案解决该问题。直接执行 convert_to_onnx.py。
2022-09-05 16:42:38
552
原创 开发系统选择路线
3.采用windowsa安装ubuntu子系统。然后使用vscode开发。2.装windows和ubuntu双系统(每次都要重启pc,切换ubuntu)1.纯装一台ubuntu的系统。(缺点用不了windows软件)去MSstore下一个ubuntu20.04即可。vscode安装Remote-WSL插件。4.windows平台使用docker。然后vscode右下角选择wsl。无法在docker中使用GPU。建议还是纯linux下开发。...
2022-07-22 16:45:07
339
2
原创 【论文阅读】YOLOv7: Trainable bag-of-freebies sets new state-of-the-art for real-time object detectors
在 5 FPS 到 160 FPS 的范围内,YOLOv7 在 speed 和accuracy 上都超过了所有已知的目标检测器,并且在 GPU V100上 30 FPS 或更高的实时目标检测器中,YOLOv7 有最高的 56.8% AP的accuracy。YOLOv7-E6 目标检测器( 56FPS V100,55.9%AP) 比基于 transformer 的检测器 SWINL Cascade-MASK R-CNN(9.2 FPS A100,53.9%AP) 的 speed ............
2022-07-16 17:19:42
4760
原创 【人脸识别】ArcFace: Additive Angular Margin Loss for Deep Face Recognition
利用深度卷积神经网络(DCNNs)进行大规模人脸识别的特征学习的主要挑战之一是设计适当的损失函数来增强识别能力。Centre loss 惩罚 深度特征与其对应的类中心在欧氏空间的距离,以实现类内紧致。SphereFace 假设最后一个全连接层中的线性变换矩阵可以用作角空间中的类中心的表示,并以乘法的方式惩罚深度特征与其相应权值之间的角度。最近,一个流行的研究方向是,将 margins 纳入成熟的损失函数,以最大限度地提高类别可分离性。本文提出了一种基于Additive Angular ......
2022-07-13 13:09:21
1594
原创 【日志异常检测】DeepLog: Anomaly Detection and Diagnosis from System Logs through Deep Learning
异常检测是建立安全可靠系统的关键步骤。系统日志的主要目的是记录系统状态和各种关键时刻的重要事件,以帮助调试系统故障和执行根本原因分析。这种日志数据在几乎所有的计算机系统中都是普遍可用的。日志数据是理解系统状态和性能问题的重要而有价值的资源;因此,各种系统日志自然是在线监测和异常检测的良好信息源。我们提出 DeepLog,一种利用长短期记忆(LSTM)的深度神经网络模型,将系统日志建模为自然语言序列。这允许DeepLog从正常执行中自动学习日志模式,当日志模式偏离 从正常执行下日志数据训练的模型 时,检测异.
2022-07-11 17:13:17
3148
原创 【时间序列异常检测】Anomaly Detection for IoT Time-Series Data: A Survey
异常检测是一个应用领域广泛的问题,它涉及到识别新的或意外的观测数据或序列被捕获的数据。目前的大多数异常检测方法都是针对个别用例的,需要专家对该方法以及应用该方法的情况有一定的了解。物联网作为一个快速发展的领域,为实施这类数据分析提供了许多机会,然而,由于物联网的性质,这可能是困难的。本文介绍了将异常检测技术应用于物联网数据时可能遇到的挑战的背景,并列举了文献中物联网异常检测应用的例子。我们讨论了在不同领域开发的一系列方法,而不限于物联网(由于该应用的相对新颖性)。最后,我们总结了当前在异常检........
2022-07-07 17:47:36
3993
原创 语音识别开源模型 -- wenet
我的需求是找到一个能用的语音识别模型用来把学习视频的音频转为字幕文件,以更好地整理学习资料。于是我尝试了下面的 wenet。文档:https://github.com/wenet-e2e/wenet初步试了试网页版,不太准呀。在windows 的 wsl 内:然后,在windows 命令行内:然后,用浏览器打开:wenet\runtime\LibTorch\web\templates\index.html输入:然后,放外音就可以识别了。目前我测试的效果并不好!当然,下次试试别的方式。....
2022-07-06 18:25:25
2973
1
原创 Anomaly-Transformer (ICLR 2022 Spotlight)复现过程及问题
Anomaly Transformer: Time Series Anomaly Detection with Association Discrepancy 复现
2022-07-01 15:07:42
3529
43
原创 【时间序列数据增强】Time Series Data Augmentation for Deep Learning: A Survey
深度学习最近在许多时间序列分析任务中表现得非常好。深度神经网络的优越性能很大程度上依赖于大量的训练数据来避免过拟合。然而,许多现实世界的时间序列应用的标记数据可能是有限的,如医学时间序列的分类和 AIOps 的异常检测。作为提高训练数据规模和质量的有效方法,数据增强是深度学习模型成功应用于时间序列数据的关键。本文系统地回顾了不同的时间序列数据增强方法。我们建议对这些方法进行分类,然后通过强调它们的优点和局限性,对这些方法进行结构化审查。我们还实证比较了不同的数据增强方法的不同任务,包括时间序列分类,异常检测
2022-06-23 15:40:27
3089
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人