- 博客(15)
- 资源 (2)
- 收藏
- 关注
原创 U-Net 学习记录
U-Net: Convolutional Networks for Biomedical Image Segmentation主要内容:背景及综述网络结构训练Trick实验结果背景(2015年)和综述卷积网络传统的应用领域是分类任务,其中图像的输出是单个的类标签。但是在许多CV任务尤其是生物医学图像领域, 所需的输出应该包括定位——类标签应该分配给每个像素。此外,得到成千上万的图像数据集在生物医学领域是很难实现的。本文在全卷积网络的基础上做了修改和扩展,以此能够用更少的训练图像并获得
2020-10-28 10:29:46
333
原创 关于类指针和类对象使用的问题
遇到的问题在写混音的时候,由于每路流的编码信息可能不一样,需要重采样为相同类型才能进行混音,所以每路流都需要一个重采样类实例。考虑内存问题,用指针应该是更好的选择,但是实际过程中,对类成员变量swrContext* 进行初始化的时候却报错了,改用类对象是可以的。参考了网上的一些博客,发现是因为类指针声明的时候没有分配内存的原因。测试了一下结果如下:int main() { ReSample re; ReSample *re_p1; ReSample *re_p2 = new ReSampl
2020-10-22 14:59:40
352
原创 【分享】 CV中关于pytorch在C++和python里的一些数据处理
简单介绍就我个人感觉而言pytorch比tensorflow简单很多,如果不了解pytorch的可以看看 知乎上的这个问题简单了解一下。由于数据处理暂时不涉及网络的搭建、模型的训练等,所以这里不讨论这些。我们使用的模型就是一个网络,网络的直接输入和输出都是tensor(计算由forward函数实现)。在我们的应用里输入和输出都是一帧帧的图像,而在C++里我们常用opencv里的mat来存储图片信息,所以重点就在于mat和tensor的相互转换。pytorch模型转换为torch script我们采用的
2020-10-09 18:05:09
330
原创 【学习记录】CSS 动画简单使用
之前我基本都没用过动画,一般都用canvas做一些画图之类的。在前几次的vilin开发中,有过几个动画效果的需求,于是我学习了一下css的动画,这里简单记录一下。css动画的特点就是简单,通过 css3创建的动画可以取代动画图片、Flash以及 JS等。常见CSS动画效果动画顾名思义可以动的图画,而这个“动”指的就是我们常见的图像变换:平移、旋转、放大、缩小,另外还包括颜色的变化:颜色加深变浅等。CSS里主要通过animation来实现元素的动画。图像变换用style里的transform属性来实
2020-09-12 14:02:59
215
原创 FFmpeg 混音学习【三】两路混流完整代码
前言本文是简单的混流实现,输入为两个媒体文件(音频或带音频的视频文件),输出为混流后的aac文件。完整代码/* * Copyright (c) 2010 Nicolas George * Copyright (c) 2011 Stefano Sabatini * Copyright (c) 2012 Clément BÅ“sch * * Permission is hereby granted, free of charge, to any person obtaining a copy
2020-07-17 11:51:55
2357
3
原创 FFmpeg 混音学习【二】FFmpeg aac音频多路混流普适情况filter初始化
前言接上一篇博客,上一篇中介绍了单路和双路混流,要是输入输出流多了像之前那样写就会很麻烦,于是考虑普适的情况,输入一个n初始化好对应的filter。具体实现定义要用到的结构体和类(里面一些参数的含义可以看我上一篇博客)输入流编码信息结构体:struct codec_info { int sample_rate; int channels; int64_t channel_layout; enum AVSampleFormat sample_fmt; AVRation
2020-07-13 11:39:17
939
原创 FFmpeg 混音学习【一】FFmpeg aac音频混流学习及问题记录
主要学习的是ffmpeg官方demo里的doc/examples/filtering_audio.cffmpeg混流的主要流程初始化filter读取aac数据,解码后将数据压入filter buffer中从buffer中取出数据编码成aac数据1、初始化filter首先定义需要使用到的变量: /** An instance of a filter */ static const char *filter_desc = "aresample=48000,aformat=sample
2020-07-11 22:34:57
1808
原创 html 输入框 oninput 事件,输入中文时多次被触发导致无法正常输入
问题:在开发公司的一个项目(scala、scalajs开发)时,遇到中文输入法无法正常输入的原因,如下图所示。经过同学提醒后,发现是oninput的问题,在中文输入法中,每输入一个拼音都会触发一次oninput而不是每输入一个字。那么解决办法呢,答案是使用compositionstart事件和compositionend事件。参考其他博客整理了一下js和scalajs版本。js版本//此部分代码摘自https://www.jianshu.com/p/e9c837eba083var typing =
2020-07-05 11:13:23
3373
原创 FFmpeg转码dash/hls等格式
本文以aac数据的转码为例,其他编码格式类似,关键是明白FFmpeg转码的原理,具体实现大同小异,转码的流程如下:主要使用的函数为:avformat_write_header()向目标文件写入文件头av_write_frame()/av_interleaved_write_frame()向目标文件写入数据av_write_trailer()结束写入目标文件主要流程如下(以下称转码器为muxer):首先调用avformat_alloc_context()来创建muxing上下文。这里初始
2020-06-26 16:05:00
1734
原创 C++ 判断文件夹是否存在和创建文件夹 (linux和windows)
在不同操作系统中创建文件夹所需要的头文件不太一样。Windows中需要如下头文件:#include <direct.h>#include <io.h>Linux中需要如下头文件:#include <sys/io.h>#include <unistd.h>#include <sys/stat.h>#include <sys/types.h>#include <dirent.h>具体代码实现如下:#if
2020-06-26 14:59:32
7089
原创 C++ Linux编译报错 jump to label ‘xxxx’ [-fpermissive]
在Linux上编译C++代码时报错 jump to label ‘xxxx’ [-fpermissive],看了下代码后发现是goto语句的问题,上网查了一下,原来是goto语句出现之后是不允许出现新声明的变量,所有新声明的变量需放在goto之前。例如:goto lab1; // 错 int a = 5;lab1:; --------------------------------------分割线------------------------------------------
2020-06-12 15:38:40
2737
转载 【转载】Linux下的tar压缩解压缩命令详解
转载:https://www.cnblogs.com/clovershell/p/10370314.htmltar-c: 建立压缩档案-x:解压-t:查看内容-r:向压缩归档文件末尾追加文件-u:更新原压缩包中的文件这五个是独立的命令,压缩解压都要用到其中一个,可以和别的命令连用但只能用其中一个。下面的参数是根据需要在压缩或解压档案时可选的。-z:有gzip属性的-j:有bz2属性的-Z:有compress属性的-v:显示所有过程-O:将文件解开到标准输出下面的参数-f是必须的
2020-06-10 21:28:04
123
原创 Windows版libfdk-acc编译教程(二)
接上一篇博客,到这里网上其他的教程就已经结束了,但是我找了半天也没找到生成的头文件只有这个.lib文件。于是这个时候,我就想用这个.lib文件来重新编译ffmpeg。此时网上的教程众说纷纭,我看了很多,找一个稍微靠谱一点的链接。关于里面涉及的MinGW和msys,其实是不用分别安装的,因为最新版的MinGW里已经包含了msys,不用重复安装。之后打开MinGW Installation Manager,下载如下图所示的几个package。[upl-image-preview url=http://disc
2020-06-03 11:57:45
1291
2
原创 Windows版libfdk-acc编译教程(一)
这是这两天汗与泪的故事(由于网上很少有windows版本的编译过程,自己边借鉴边摸索了一个方法,不知道是不是最优的,目前写了个demo编码是可以的)。。。????由于FFmpeg本身带有的aac编码会存在较大的延时(其实是libfdk已经从ffmpeg独立出来),查阅资料确定选择libfdk-aac作为编解码工具,可以理解为libfdk-aac是当前最高质量的AAC编码。具体介绍可见此链接。下面为编译fdk-aac的过程:下载fdk-aac源码https://downloads.sourceforg
2020-06-03 11:40:57
2500
原创 dlib 编译出现USER_ERROR__inconsistent_build_configuration__see_dlib_faq_1 和2 的问题
编译dlib后,在使用它的时候报了这两个错USER_ERROR__inconsistent_build_configuration__see_dlib_faq_1一般是静态库没有引用上,可以检查一下cmake设置的路径,比如确定到具体某个.lib文件dlib release 编译的,项目也需要是release 编译的USER_ERROR__inconsistent_build_configuration__see_dlib_faq_2在dlib/config.h,最后一行增加:#def
2020-05-15 12:10:40
1721
2
ffmpeg_muxer.cpp
2020-06-26
libfdk-aac Windows上编译用的CMakeLists.txt
2020-06-03
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人