- 博客(130)
- 收藏
- 关注
原创 vscode播放MP4文件时候没声音
从上面描述可以看出,大概率是视频中的音频编码器使用了AAC,改成wav, mp3, flac等就可以了。vscode 播放MP4文件时候没有声音。
2024-10-12 14:40:57
1126
原创 论文笔记:Image Anaimation经典论文-运动关键点模型(Monkey-Net)
Monkey-Net(MOviNg KEYpoints)paper: https://arxiv.org/pdf/1812.08861, CVPR 2019code: https://github.com/AliaksandrSiarohin/monkey-net/tree/master该任务定义为给定一幅静态图像,和一个参考动作视频,让静态图像中物体按照参考图像中物体运动。该任务的核心可以分为解偶-重构两个阶段:在人脸Animation中,经典3D MM模型是经常被使用的模型,但其局限性非常明显:结合
2024-05-31 15:30:10
1334
1
原创 数字人技术:相关论文汇总
Distangled face representation learning单位/会议/时间方法摘要MM 2022MegaPortraits: One-shot Megapixel Neural Head Avatars, paperTalking Face Generation单位/会议/时间方法摘要–Awesome-Talking-Face: https://github.com/JosephPai/Awesome-Talking-Face
2024-04-23 13:23:40
1487
原创 数字人技术:VASA-1阅读笔记 & 代码汇总
论文地址:引入了5个约束条件,包括主要注视方向、头部到摄像头的距离、情绪偏移量、为了增加帧间平滑性,还增加了前K帧的语音特征和生成的运动特征,具体如下:θϕ)deKApreKXpre。
2024-04-23 11:42:36
1693
原创 Vim: 使用tags文件扩展YCM对C族语言第三方库的代码自动补全功能
在众多Vim编辑器的自动补全插件中,绝对是最好用的插件之一,但其配置过程往往令初学者望而却步。经过笔者多年折腾,至今基本达到满足日常使用水平。如果读者对YouCompleteMe这个插件不熟悉,建议首先参考笔者的博客Vim配置Python和C++常用插件。为更好地理解本文,建议读者首先阅读我的上一篇博客Vim扩展YCM对C族语言第三方库的语义分析功能。在这篇博客中,我们解决了YCM的语义分析出错问题,但对自动补全功能的提升有限。......
2022-07-22 13:05:44
1784
原创 Vim: 扩展YCM对C族语言第三方库的语义分析功能
在众多Vim编辑器的自动补全插件中,绝对是最好用的插件之一,但其配置过程往往令初学者望而却步。经过笔者多年折腾,至今基本达到满足日常使用水平。如果读者对YouCompleteMe这个插件不熟悉,建议首先参考笔者的博客Vim配置Python和C++常用插件。在使用Vim编辑C族语言代码时,如果额外使用了某些第三方库(如OpenCV),会发现YCM解析失效,找不到库文件,后序自动联想也无法使用。为此,本文结合YCM文档,首先分析一下为什么YCM在此情况下会失效,然后再给出对应的解决方案。.........
2022-07-22 13:04:04
1447
原创 算法: 回溯
回溯算法的本质是对树型或者图型结构进行一次深度优先搜索,是一种暴力搜索算法,因此其时间复杂度是较高的,为指数级别。从题目列表来看,几乎所有的回溯算法全部可以用一个树形图来帮助我们设计程序。只有深刻理解如何绘制树形图,才能设计出回溯算法,并做出相应的剪枝操作来提升算法的效率。代码随想录中总结了一套“回溯三部曲”较为实用,其中还提供了一个回溯算法的代码模板,学习前期可以根据这个模板感受回溯算法的表象,慢慢地再深刻理解其本质,具体内容见参考资料[1]。......
2022-06-15 17:49:06
243
原创 Leetcode算法刷题记录
数组704. 二分查找27. 移除元素209. 长度最小的子数组54. 螺旋矩阵59. 螺旋矩阵 II链表203. 移除链表元素206. 反转链表19. 删除链表的倒数第 N 个结点141. 环形链表142. 环形链表 II
2022-05-23 18:04:49
293
原创 学习Transformer:自注意力与多头自注意力的原理及实现
自从Transformer[3]模型在NLP领域问世后,基于Transformer的深度学习模型性能逐渐在NLP和CV领域(Vision Transformer)取得了令人惊叹的提升。本文的主要目的是介绍经典Transformer模型和Vision Transformer的技术细节及基本原理,以方便读者在CV领域了解和使用Vision Transformer。......
2022-05-15 07:55:27
22136
8
原创 Linux服务器远程连接工具:Tmux
本文介绍了使用ssh连接服务器时意外中断的解决方案,笔者对比了screen和tmux两种工具,发现tmux更强大一些。相比于screen,tmux工具不仅可以将当前窗口会话与正在执行的任务分离(使任务在后台运行),而且具有更丰富的切屏和图形界面。因此,tmux工具是防止远程服务器连接意外中断的更佳选择。...
2022-03-18 13:04:48
2401
原创 计算机语言丛书学习:C\C++\JAVA\Python 基础-案例-应用
市面上的计算机语言类丛书层出不穷,各有特点。与现有书籍相比,本文介绍的计算机语言系列书籍具有案例驱动、基础详细、重视实战等特点,从入门到进阶均可参考,是值得考虑的系列丛书之一。
2022-03-17 21:52:27
1499
原创 计算机视觉数据集介绍:KITTI数据集
KITTI数据集是由德国卡尔斯鲁厄理工学院和丰田美国技术研究院联合创办,利用组装的设备齐全的采集车辆对实际交通场景进行数据采集获得的公开数据集。该数据集包含丰富多样的传感器数据(有双目相机、64线激光雷达、GPS/IMU组合导航定位系统,基本满足对图像、点云和定位数据的需求)、大量的标定真值(包括检测2D和3D包围框、跟踪轨迹tracklet)和官方提供的一些开发工具等。...
2022-03-17 18:23:48
17837
1
原创 学习C++: VSCode配置C++开发环境
VSCode相比于Visual Studio来说更加轻量化,且可以跨平台使用,因此,本文通过文字结合大量截图一步步总结了如何在VSCode上配置C++开发环境。
2022-01-26 13:20:58
972
原创 机器学习基础:K近邻算法(Machine Learning Fundamentals: KNN)
k近邻法(k-nearest neighbor, k-NN)是1967年由Cover T和Hart P提出的一种基本分类与回归方法。本文主要总结了K临近算法的基本原理及优缺点等信息。
2021-03-24 23:16:21
666
原创 机器学习基础:期望最大化算法(Machine Learning Fundamentals: EM Algorithm)
EM算法和MLE算法的相同点在于,两者都需要知道确定的概率密度函数形式。若没有隐藏变量,则可以用MLE进行估计。若数据欠缺,或存在隐含变量,则无法使用直接使用MLE进行估计,因此需要使用EM算法。
2021-03-24 22:36:43
543
原创 计算机视觉基础:霍夫变换(Computer Vision Fundamentals: Hough Transform)
本文主要介绍了图像处理技术中的霍夫变换原理,同时介绍了OpenCV中实现的概率霍夫变换基本原理及流程。
2021-03-24 22:32:39
886
原创 计算机视觉基础:自适应阈值分割(Computer Vision Fundamentals: Adaptive Threshold Segmentation)
阈值分割方法虽然简单,但是如果场景简单,还是可以尝试使用的,因为其消耗的时间较少。同时,阈值分割也可以作为一个baseline来验证提出的新算法是否有效。本文主要介绍了OpenCV中介绍的两种自适应阈值分割算法,在实际工程中较常使用。
2021-03-24 22:26:44
4313
1
原创 机器学习基础:支持向量机(Machine Learning Fundamentals: Support Vector Machine, SVM)
支持向量机的核心思想很简单:在众多可行的分类的超平面中,选择一个超平面,使得两类样本到该超平面的间隔最大。本文通过图示和公式推导总结了支持向量机的基本原理,并介绍了支持向量机中用于非线性分类的核技术。
2021-03-24 22:07:20
889
原创 机器学习基础:极大似然估计(Machine Learning Fundamentals: Maximum Likelihood Estimation)
极大似然估计的核心思想是:利用已知数据来计算最可能获得这种数据分布的概率密度函数。
2021-03-24 21:57:54
369
原创 机器学习基础:主成分分析(Machine Learning Fundamentals: PCA)
PCA降维的核心思想在于: 将原始数据映射到低维度的正交基底上,映射之后的数据能最大限度的分开,即协方差矩阵要对角化。实际操作时发现:依赖矩阵的正交变换,将原始数据XXX的协方差矩阵对角化。对角化之后特征值对应的特征向量就是我们要求的新的基底。无论是PCA的核心思想还是推导过程其实都很简单,如果对PCA的细节不懂,通常是基础知识掌握的不够,同时对矩阵正交变换的几何意义了解不够。本文从基础到进阶,不断展开对PCA技术细节的总结。
2021-03-24 21:51:42
237
原创 机器学习基础:逻辑回归(Machine Learning Fundamentals: Logistic Regression)
简单来说, 逻辑回归(Logistic Regression)是一种用于解决二分类(0 or 1)问题的机器学习方法,用于估计某种事物的可能性。比如某用户购买某商品的可能性,某病人患有某种疾病的可能性,以及某广告被用户点击的可能性等。 注意,这里用的是“可能性”,而非数学上的“概率”,logisitc回归的结果并非数学定义中的概率值,不可以直接当做概率值来用。该结果往往用于和其他特征值加权求和,而非直接相乘。
2021-03-24 21:40:43
215
原创 机器学习基础:朴素贝叶斯(Machine Learning Fundamentals: Naive Bayes)
朴素贝叶斯是一类假设特征之间具有统计独立性的有监督方法。因此,朴素贝叶斯的使用条件就是假设不同特征之间具有统计独立性。本文总结了朴素贝叶斯的基本原理。
2021-03-24 21:33:06
382
原创 学习vim: vim cheat sheet
前言关于VIM的快捷键,我发现最好的学习方式是把它们写下来放在眼前,忘了就看一眼,其实不用刻意去记,时间长了就记下来了。Vim Cheat Sheet以下是我查找的两个较好的VIM cheat sheet,供自己记忆使用,读者可以打印出来放在桌面上,或者将常用的命令摘抄在A4纸上,一点点累加新的命令。...
2020-11-23 12:46:54
805
原创 学习python:logging模块
Demoimport loggingimport syslogging.basicConfig(filename='./test.log', filemode='a', level=logging.INFO, format='%(asctime)s %(message)s', datefmt='%H:%M:%S')logger = logging.getLogger()logger.addHandler(logging.StreamHandler(sys.stdout))logger.inf
2020-10-27 23:12:57
138
原创 可视化技巧:分类问题中的决策面画法 (直观理解plt.contour的用法)
通过分类问题中决策面的绘制过程直观理解skimage中contour的用法。主要包括对 np.meshgrid 和plt.contour的直观理解。
2020-07-05 10:55:31
8333
1
原创 学习LaTex:常用符号总结
虽然现有资料中有很多关于latex中的常用符号和命令,但它们的排版和顺序不符合我的思路,有时查一个命令需要半天,因此这里重新总结一份。我常用的字典一样的资料就是文献[1],非常全面,但是很多命令八百年也用不上一次,因此有时找需要的信息如大海捞针。本文根据自己的需求,在文献[1]的基础上去掉了大多数不常用的命令,增加了少量自己常用但是文献[1]中没有的命令。
2020-07-04 10:22:36
2112
原创 学习python: 常见面试题总结
自己总结下python常见的面试题,这里没写答案,方便多次回顾。基础知识 深拷贝和浅拷贝的区别 List和Tuple的区别 解释python中的三元运算符 python是如何管理内存的 解释Python中的help()和dir()函数 当退出Python时,是否释放全部内存? Python中的字典是什么? 请解释使用*args和**kwargs的含义 请写一个Python逻辑,计算一个文件中的大写字母数量 什么是负索引? 如何以就地操作方式打乱一个列表的元素? Python区分
2020-06-14 19:04:00
186
原创 机器学习基础:Dice Loss(Machine Learning Fundamentals: Dice Loss)
为了验证dice作为loss function,是否会被分割物体面积的大小所影响,设计本实验。
2020-04-25 23:21:19
1308
原创 机器学习基础:评价指标(Machine Learning Fundamentals: Evaluation Metrics)
PrecisionRecallAccuracyF1F_1F1 ScoreFβF_\betaFβ ScoreDicePR CurveROC Curve参考文献调和平均数的物理意义wikipedia Harmonic mean百度百科:调和平均数百度百科:F1F_1F1分数优快云:机器学习中的F1-scorewikipedia Tversky indexTve...
2020-04-25 23:16:58
277
原创 以一定概率执行某段代码(Python实现)
简介在数据扩增中,我们希望程序以一定概率执行某个扩增的行为,比如图像翻转; 在deep-medic中提到使用一定概率做某件事(忘了干啥了)。因此这种以一定概率做某件事在生活中还是很常用的,发现这种做法其实很简单,这里参考 Augmentor中使用的方法,将此类问题记录下来。内容这里粘贴了自己写的一个类,主要参考第22行即可。 15 class ElasticTransform(objec...
2020-04-25 23:15:21
2150
原创 机器学习基础:最大似然(Maximum Likelihood) 和最大后验估计 (Maximum A Posteriori Estimation)的区别
前言在研究SoftMax交叉熵损失函数(Cross Entropy Loss Function)的时候,一种方法是从概率的角度来解释softmax cross entropy loss function的物理意义[1]。我们再来回顾下分类器输出的Probability Map,如下:P(yi∣xi;W)=efyi∑jefjP(y_i \mid x_i; W) = \frac{e^{f_{y_...
2020-04-25 23:07:55
2143
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人