自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(117)
  • 收藏
  • 关注

原创 vscode常用快捷键

vscode常用快捷键1.主命令框2.代码编辑器2.1 代码格式相关2.2 光标相关2.3 重构代码3.显示相关4.修改默认快捷键vscode里的快捷键太多了,让人眼花缭乱,可我们只要记住常用的几个就能很好地提升开发效率,因此进行归纳总结,加粗为对提高效率帮助比较大的快捷键。1.主命令框F1 或 Ctrl+Shift+P(俗称万能键) :打开命令面板。在打开的输入框内,可以输入任何命令Ctrl+P:按一下 Backspace 会进入到 Ctrl+P 转到模式在 Ctrl+P 下输入 >

2021-11-28 01:35:50 4681 1

原创 【TTS】TTS常用的声码器介绍

在语音合成(TTS)系统中,声码器(Vocoder)是将声学特征(如梅尔谱图)转换为高质量波形音频的核心组件。如需具体模型代码或数据集,可参考微软亚洲研究院的。

2025-02-25 17:59:11 1021

原创 【踩坑】解决Hugging-face下载问题

hugging-face镜像hf-mirror.com

2025-01-30 15:47:49 2358

原创 【踩坑】Nltk报错TypeError: unsupported operand type(s) for +: ‘ZipFilePathPointer‘ and ‘str‘

这里的其中一个目录下,记住要把zip文件解压缩,下面是递归解压缩的python代码供参考。但大概率拒绝连接,这时候就得去访问nltk_data的github。用git clone或者其他手段下载下来,打开里面的package。把package里的对应文件(如果保守点所有文件也行),放在。提示会让我们下载某些包,但很可能提示下载失败。

2025-01-28 17:24:52 564 1

原创 【大数据/踩坑/Linux】启动HDFS报错localhost: Permission denied (publickey,password).

hdfs启动权限问题报错,给出几种可能解决办法

2024-12-26 17:42:05 738 1

原创 【Linux/踩坑】Linux中启动eclipse或HDFS因JAVA_HOME设置报错

Linux中启动eclipse或HDFS因JAVA_HOME设置报错解决方案

2024-12-26 17:29:47 300

原创 【踩坑/Linux】Vmware中的Ubuntu虚拟机无法访问互联网

Ubuntu 16.04和vmware workstation操作环境

2024-12-26 17:01:24 1195

原创 【踩坑】pip离线+在线在虚拟环境中安装指定版本cudnn攻略

清华源官方帮助文档标题的离线的意思是先下载whl文件再安装到虚拟环境,在线的意思是直接在当前虚拟环境下使用

2024-12-18 21:28:37 609

原创 【pip】pip常用命令及pip install部分含义

本文介绍pip常用命令及pip install的部分选项含义参考

2024-12-18 21:27:35 1247

原创 【踩坑】Pytorch与CUDA版本的关系及安装

Pytorch与CUDA版本的关系及安装

2024-12-17 02:43:32 10912

原创 【踩坑】pip安装依赖卡在Installing build dependencies ...

设置pip镜像源

2024-12-05 16:04:22 5954

原创 【大数据】在win11下使用IDEA进行Spark实践

spark,scala,IDEA

2024-11-29 16:05:55 1075

原创 【Paper Note】跨音频-视觉匹配识别的3D CNN

讨论了跨音频-视觉匹配识别(AVR),即在音频被干扰或者在多说话者场景中用于说话者验证的视觉识别方法。文章的核心是提出一种耦合的3D卷积神经网络(3D CNN)架构,用于将音频和视觉两种模态映射到一个表示空间中,以评估音频-视觉流之间的对应关系,并使用学习到的多模态特征,找到不同模态时间信息之间的相关性。数据准备:数据集:使用Lip Reading in the Wild (LRW) 和 West Virginia University Audio-Visual Dataset (AVD) 数据集。

2024-11-13 17:15:16 1060

原创 【Paper Note】伪造片段及方法分割Spoof Diarization: “What Spoofed When” in Partially Spoofed Audio

任务目标的差异Spoof检测:目标是判断整个音频信号是否包含伪造片段,关注的是一个二元问题(是或否)。Spoof定位:目标是在音频中定位出伪造和真实的区域,但通常不区分伪造片段的具体伪造方法。:不仅要定位伪造区域,还要根据不同的伪造方法对这些区域进行聚类,提供更详细的伪造信息。开放集挑战Spoof检测和定位:可能不需要处理训练数据中未见过的伪造方法。:需要能够处理训练时未见过的伪造方法,即“开放集”挑战,这要求系统能够识别和聚类未知的伪造技术。处理伪造片段的粒度。

2024-11-01 18:23:28 992

原创 【Paper Note】利用Boundary-aware Attention边界感知注意力机制增强部分伪造音频定位

部分伪造音频定位的任务旨在准确确定帧级别的音频真实性。尽管一些工作取得了令人鼓舞的成果,但在单个模型中利用有界信息仍然是一个未经探索的研究课题。在这项工作中,我们提出了一种称为边界感知注意力机制Boundary-aware Attention Mechanism的新方法。“边界”(Boundary)指的是在音频信号中,真实语音和合成语音(或伪造语音)相接合的地方。这些边界区域通常包含混合了真实和伪造音频的帧,对于检测和定位伪造音频来说,识别这些边界位置是非常重要的。

2024-10-31 16:42:02 1430

原创 windows如何通过命令提示符下载ftp服务器上的文件到本地指定目录

从FTP服务器下载文件

2024-10-09 21:32:56 1641

原创 视频扩散模型介绍 Video Diffusion Models Introduction

扩散过程和去噪过程去噪器,预测出来噪声然后与原始图片相减,得到干净的图片当然,去噪过程是逐步的,所以减去之后会重新加上“平均噪声”跳步DDIM和DDPM作对比:

2024-03-05 15:21:03 2879 2

原创 CV及LLM常见名词解释

看论文的时候,有些术语虽然常见但是却让人很难理解具体含义,如noise等,这里是一些常见术语的解释,同时也给出了这些术语所在的上下文及模型。

2024-02-28 17:05:24 877

原创 论文编写思路

论文写作相关,科研小白入门

2024-02-27 13:32:28 944

原创 【git】工作场景中常用的git命令

工作场景中常用的git命令,记录下来方便调取。

2023-08-25 12:20:57 1834

原创 【php】windows下php运行已有php web项目环境配置教程

本文操作系统使用的是win11

2023-08-22 11:52:49 1573

原创 【Go】Goland项目配置运行教程

注意,本项目描述的是git clone下来的Golang项目配置运行教程,并不是从头创建一个Golang项目并运行作者是在win11系统上使用goland进行的实践,其他操作系统和比编辑器请谨慎参考。

2023-08-21 18:11:02 7372

原创 【运维】DevOps全流程笔记(未完成)

DevOps全流程笔记,目前只完成了一小部分

2023-07-24 02:47:11 1011

原创 【Java】一些常问的问题

一些常问问题的答案

2023-07-18 01:18:30 380

原创 【JMeter】JMeter进行JDBC数据库负载测试

此示例使用 MySQL 数据库驱动程序

2023-07-17 02:46:36 321

原创 【java】JMeter进行web测试

参考JMeter用户手册。

2023-07-17 01:17:45 1696

原创 【Java/大数据】Kafka简介

主要内容是kafka的原理和使用参考。

2023-07-14 00:25:17 1691

原创 【大数据】大数据简介

大数据简单介绍

2023-07-13 13:42:36 199

原创 【Java】Map(包括HashMap)

HashMap

2023-07-11 16:14:37 199

原创 【Java】Java数据类型

基本数据类型和包装类型

2023-07-11 15:09:32 248

原创 【Java】微服务项目的部署

本文参考mall4j文档,结合自己的思考和实际进行修改,侵联删。

2023-07-10 22:12:38 625

原创 【线性代数】快速复习笔记

线代快速复习笔记

2023-06-29 16:52:52 1699 2

原创 【C++】继承与多态

C++继承与多态介绍

2023-06-29 01:43:11 214

原创 【Paper】复现VideoMAE

VideoMAE: Masked Autoencoders are Data-Efficient Learners for Self-Supervised Video Pre-Training论文复现注意事项

2023-06-27 02:46:25 1906 4

原创 如何在kaggle上下载输出文件

在kaggle下载output文件

2023-06-24 19:58:52 2346 2

原创 【Paper】复现论文Prototypical Networks for Few-shot Learning

论文复现时的一些踩坑和经验

2023-06-23 17:38:23 1209

原创 【踩坑】复现End-to-End Referring Video Object Segmentation with Multimodal Transformers

论文复现过程的一些踩坑

2023-06-22 03:59:36 543

原创 【踩坑】Windows11安装WSL2,然后装miniconda

能够看到出现了很多处理器的信息,最末尾有个 Hyper-V 要求,如果四个全为 “是”,则表示支持 Hyper-V 功能。参考教程https://zhuanlan.zhihu.com/p/475462241。在Win11搜索框,PowerShell 输入 systeminfo 命令。桌面新建一个记事本文件,将它的后缀改成cmd或bat,复制下面的代码。是由Win11控制面板可能没有HyperV选项引起。然后,右键选择:以管理员身份运行。代码执行结束后,重启电脑就可以了。

2023-06-21 03:38:37 1359

原创 【软件测试】软件测试管理

软件测试管理相关

2023-06-03 00:32:57 1541

原创 【软件测试】白盒测试与黑盒测试

本文介绍白盒测试与黑盒测试有关内容,并伴随例子讲解

2023-06-02 21:06:00 24913 9

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除