自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(41)
  • 资源 (6)
  • 收藏
  • 关注

原创 H264原理与源码阅读、实践心得

DCT与近似DCT变换原理DCT的目的在于将高频、低频图片信息分离,这样就能舍弃高频分量,达到压缩的目的。DCT的重点在于矩阵的运算,运算的过程如下但是这种方式涉及三角函数计算,因此为了计算方便,通过近似DCT变化来简化运算。 Python实现#import numpy as np###待压缩图像块X=np.array(([5,11,8...

2018-07-23 16:20:47 306

原创 Ubuntu安装ollama,并运行ollama和通义千问,使用gradio做界面

修改pip下载的源为国内源,这样下载的速度更快,注意这里的路径记得替换成自己电脑安装miniconda的路径。运行后,可以看到绑定了一个本地的端口7860,在浏览器中打开,就能看到对应的界面。前端我们使用python创建访问的接口,并使用gradio创建前端页面。在终端中打入,如下命令可以查看本机安装的大模型。使用下面的命令,可以将相应的模型运行起来,接着打入粘贴上面的命令,回车后自动安装。接着打入粘贴上面的命令,回车后自动安装。可以看到,会出现绑定的端口11434。运行后,可以看到如下的输出,

2024-11-16 11:12:35 2189 2

原创 从零开始使用Intel的AIPC使用xpu加速comfyui

接下来写一个运行的脚本,保存成1.cmd放在用户目录下,这样每次cmd运行时,首先执行1.cmd就能激活该环境。使用默认的工作流输出一张图片,从图片中可以看到经过xpu加速后,一张出图的时间大概是5分钟。安装好后重启comfyui,进入系统设置,修改语言中文即可。这个模式下,cpu执行非常慢,按这个估算,估计要1个多小时。win+r 打开cmd,然后运行1.cmd。可以看到如下的输出代表环境搭建成功。命令行运行,可以看到使用的时xpu。安装好后,通过命令行设置清华源。首先上面搭建的环境中。

2024-11-11 11:19:17 1199

原创 Windows on ARM上使用sherpa-onnx实现语音识别

特别要注意,这里的模型只支持单声道的wav文件,千万不能双声道,录制一段音频后保存成单声道的,命名为8k.wav并放在speech-recognition-from-microphone.py文件的相同目录下。将如下的代码保存成一个speech-recognition-from-microphone.py文件,并跟模型放在一起,像这样。模型所在的地址在这里(),通过git命令将模型下载下来。

2024-10-30 12:40:22 472

原创 Windows on ARM编译python的sherpa-onnx库

Sherpa,作为Next-gen Kaldi项目的一个部署框架,它支持将语音相关的预训练模型部署到各种平台上,并且支持多种语言绑定。具体来说,Sherpa的功能和特点包括:跨平台部署:Sherpa可以将语音模型部署到不同的硬件和软件平台上,包括云服务器、边缘设备(如智能手机、IoT设备等)等。这种跨平台的能力使得Sherpa具有很高的灵活性和适应性,可以满足不同场景下的需求。多种语言绑定:Sherpa支持多种编程语言接口,如Python、C++等。

2024-10-30 12:24:21 462

原创 Windows on ARM编译安装openBLAS

OpenBLAS可以使用LLVM工具链(clang-cl和flang)从源代码为Windows on ARM(WoA)进行构建。v0.3.24版本(预构建包)的构建和测试已通过。

2024-10-30 11:53:38 290

原创 Window on ARM解锁所有的TTS语音包供python调用

但只有部分已安装的语音能在整个系统中使用,以便第三方软件和服务也能利用它们。那怎么解锁更多的语音包可以解锁Windows on ARM中的所有文本转语音(TTS)语音,使它们能够被任何使用Windows on ARM提供的语音的程序或应用所使用。当你在Windows on ARM电脑上打开一个使用语音的第三方程序时,仅会提供其中的部分语音。上面的截图显示了当你在讲述人中选择语音选择器时,有多少语音可供选择。如果你打开“设置”搜索语音菜单,并选择其中的“选择语音”菜单,你会看到一个可用的语音列表。

2024-10-30 10:50:11 251

原创 Window on arm上编译pytorch

pip无法安装,想自己编译,并且有错误的都可以看这篇。

2024-10-29 20:21:48 209

原创 Window on arm编译onnxruntime的python安装包

下载visual studio安装包,并在线安装visual studio 2022 版本,安装完成后安装“c++桌面应用开发”相关的组件。如果你是在window on arm 平台上编译,直接打开powershell进入源码目录。下载cmake arm版本并安装,可在cmake官网上找到相应的arm版本。须在高通的官网注册后才能下载,下载安装后,进入该目录,运行ps脚本。编译完成后,就会生成wheel安装包,然后再安装即可。如果是要生成python的安装包则。运行后,就会自动编译完成。

2024-10-25 22:00:00 299

原创 [H264]x264_encoder_headers函数

x264_encoder_headersH264中我们所说的帧是不包含全部的视频的数据的,它是由网络数据NAL和视频数据VCL组成。这个函数主要用来生成一个帧的NAL数据层,这个函数主要是输出SPS、PPS、SEI等数据封装。具体来看代码int x264_encoder_headers( x264_t *h, x264_nal_t **pp_nal, int *pi_nal )...

2024-10-19 23:14:32 162

原创 思科路由器配置NAT地址转换

静态NAT转换采用如图所示的结构,每个端口配置如下的ip首先得理解这个结构,r4的s2/0端口和r6和pc8共同组成外网r4的f0/0和交换机s2以及pc6 pc7组成内网,因此配完ip后,还得保证r4能ping通pc8同样pc8也能ping通r4的s2/0因此需要添加静态路由在r4上configure terminal ip route 192.168.3.0 255.255.255.0 192.168.2.2该条命令保证r4能ping通pc8r4和pc8由于是直接连接在路由器

2021-11-25 21:27:09 11789

原创 思科路由器dhcp服务器配置

路由器DHCP服务器dhcp服务器采用如下的结构首先enable configure terminal#设置dhcp地址池service dhcpip dhcp pool xinlannetwork 192.168.11.0 255.255.255.0dns-server 192.168.11.1default-router 192.168.11.1exit## 设置连接的端口ip address 192.168.11.1 255.255.255.0no shutdown

2021-11-24 20:41:18 10425

原创 Ubuntu14.04设置samba共享文件夹

samba共享文件夹Samba是在Linux和UNIX系统上实现SMB协议的一个免费软件,由服务器及客户端程序构成。SMB(Server Messages Block,信息服务块)是一种在局域网上共享文件和打印机的一种通信协议,它为局域网内的不同计算机之间提供文件及打印机等资源的共享服务。SMB协议是客户机/服务器型协议,客户机通过该协议可以访问服务器上的共享文件系统、打印机及其他资源。通过设置“NetBIOS over TCP/IP”使得Samba不但能与局域网络主机分享资源,还能与全世界的电脑分享资源

2021-11-15 07:45:00 1667 2

原创 Ubuntu 14.04安装FTP服务器

安装采用如下命令安装ftp服务器sudo apt install vsftpd软件管理软件管理方式service vsftpd start 启动service vsftpd restart 重启service vsftpd stop 停止service vsftpd status 查看状态匿名访问方式修改配置文件gedit /etc/vsftpd.conf并写入配置anonymous_enable=YESanon_root= /data/publocal_

2021-11-08 09:40:50 1228

原创 MQTT使用与C接口测试

MQTT从入门到编程MQTT服务器安装与配置1、安装使用apt包管理工具安装sudo apt install mosquitto 2、修改配置切换到/etc/mosquitto/目录下修改配置cd /etc/mosquitto/sudo gedit mosquitto.conf添加两个配置allow_anonymous falsepassword_file /etc/mosquitto/pwfile.txt紧接着,按照上面的配置添加/etc/mosquitto/pwfile.

2021-10-31 20:09:52 4956

原创 Ubuntu 14.04下编译OpenCV4

一、准备下载opencv源码1、git clone https://github.com/opencv/opencv.git2、可以通过下载zip包的方式、安装cmake g++等编译工具切换到root用户下,并安装编译工具链apt install cmake3 cmake3-qt-gui g++解压源码unzip opencv-master.zip二、配置并编译首先,在opencv目录下配置两个文件夹,build和installbuild用来保存中间编译生成的临时文件in

2021-10-25 08:56:08 2141

原创 【ffmpeg-libav-tutorial】ffmpeg中同步音视频流

音视频同步在转码之前,我门先来谈谈时间。换句话说播放器是如何实现音视频同步的,如何知道在什么时间播放一帧。上一个例子中,我门保存了一些帧。我们希望播放器以一定的节奏打印每个帧而不至于播放得太快或者太慢。因此我们需要引入一些机制来使播放流畅。为了达到这个目的,每个帧都有一个显示时间(pts),它是个递增的数据,并且是以一个时间基为基准,该时间基是一个有效数(他的分母被称为时间尺度)可以被帧率...

2019-03-05 16:00:02 469

原创 【ffmpeg-libav-tutorial】ffmpeg的hello world

FFmpeg的hello worldffmpeg的hello world并不是打印hello world,而是打印视频的信息。比如他的容器格式、长度、分辨率、音频通道,最后我们将会解码一些帧并将他们保存为图片ffmpeg的架构首先先了解一下ffmpeg的架构以及他的组件如何与其他组件进行通信,如图是视频解码的过程:首先,我们需要将视频文件加载到AVFormatContext结构体,实际上...

2019-03-05 10:42:17 648

原创 【ffmpeg-libav-tutorial】介绍——视频、音频、编码器、容器、使用方法

介绍——视频、音频、编码器、容器介绍视频——你所看到的音频编码器——数据压缩容器FFmpeg-命令行FFmpeg命令行工具介绍视频——你所看到的如果你有一序列的图片,并且以一个给定的频率来改变他们出现的时间(比如24张图片每秒),那么你就能看到一个运动的感觉。换句话来说,视频的基本思想就是:以一定的速率改变一系列图片的出现。音频虽然静音视频已经能够表达各种各样的感受,但是往视频里添加声...

2019-03-04 21:00:47 846

原创 LeetCode刷题——Array篇(Max Chunks To Make Sorted)

Given an array arr that is a permutation of [0, 1, …, arr.length - 1], we split the array into some number of “chunks” (partitions), and individually sort each chunk. After concatenating them, the re...

2018-05-17 15:16:48 191

原创 Linux搭建DNS服务器记录

1、安装后named -v查看版本号,方便查找相应教程2、编辑/etc/named.conf//// named.conf//// Provided by Red Hat bind package to configure the ISC BIND named(8) DNS// server as a caching only nameserver (as a localh...

2018-05-15 11:34:55 1347 1

原创 LeetCode刷题——Array篇(Array Nesting)

A zero-indexed array A of length N contains all integers from 0 to N-1. Find and return the longest length of set S, where S[i] = {A[i], A[A[i]], A[A[A[i]]], … } subjected to the rule below.Suppose ...

2018-05-10 15:57:46 191

原创 LeetCode刷题——Array篇(Product of Array Except Self)

Given an array nums of n integers where n > 1, return an array output such that output[i] is equal to the product of all the elements of nums except nums[i].Example:Input: [1,2,3,4] Output: ...

2018-05-10 11:42:29 164

原创 LeetCode刷题——Array篇(Find All Duplicates in an Array)

Given an array of integers, 1 ≤ a[i] ≤ n (n = size of array), some elements appear twice and others appear once.Find all the elements that appear twice in this array.Could you do it without extra ...

2018-05-10 11:37:44 180

原创 LeetCode刷题——Array篇(Maximum Average Subarray I)

Given an array consisting of n integers, find the contiguous subarray of given length k that has the maximum average value. And you need to output the maximum average value.Example 1: Input: [1,12,...

2018-04-23 17:40:56 172

原创 LeetCode刷题——Array篇(Two Sum)

Given an array of integers, return indices of the two numbers such that they add up to a specific target.You may assume that each input would have exactly one solution, and you may not use the same ...

2018-04-23 14:50:39 212

原创 LeetCode刷题——Array篇(Find Pivot Index)

Given an array of integers nums, write a method that returns the “pivot” index of this array.We define the pivot index as the index where the sum of the numbers to the left of the index is equal to ...

2018-04-23 11:14:21 229

原创 LeetCode刷题——Array篇(Maximum Subarray)

Maximum SubarrayGiven an integer array nums, find the contiguous subarray (containing at least one number) which has the largest sum and return its sum.Example:Input: [-2,1,-3,4,-1,2,1,-5,4], O...

2018-04-20 14:56:35 247

原创 LeetCode刷题——Array篇(Move Zeroes和Remove Element)

Move ZeroesGiven an array nums, write a function to move all 0’s to the end of it while maintaining the relative order of the non-zero elements.For example, given nums = [0, 1, 0, 3, 12], after ca...

2018-04-19 21:07:17 237

原创 LeetCode刷题——Array篇(Best Time to Buy and Sell Stock)

Say you have an array for which the ith element is the price of a given stock on day i.If you were only permitted to complete at most one transaction (ie, buy one and sell one share of the stock), d...

2018-04-18 16:26:17 234

原创 LeetCode刷题——Array篇(Min Cost Climbing Stairs)

On a staircase, the i-th step has some non-negative cost cost[i] assigned (0 indexed).Once you pay the cost, you can either climb one or two steps. You need to find minimum cost to reach the top of ...

2018-04-18 15:10:19 162

原创 LeetCode刷题——Array篇(Degree of an Array)

Given a non-empty array of non-negative integers nums, the degree of this array is defined as the maximum frequency of any one of its elements.Your task is to find the smallest possible length of a ...

2018-04-18 14:16:36 139

转载 LeetCode刷题——Array篇(寻找两数和)

167. Two Sum II - Input array is sortedGiven an array of integers that is already sorted in ascending order, find two numbers such that they add up to a specific target number.The function twoSum ...

2018-04-16 17:18:47 151

原创 LeetCode刷题——Array篇(Best Time to Buy and Sell Stock II)

Say you have an array for which the ith element is the price of a given stock on day i.Design an algorithm to find the maximum profit. You may complete as many transactions as you like (ie, buy one ...

2018-04-16 16:22:48 137

转载 LeetCode刷题——Array篇(对角线相等)

A matrix is Toeplitz if every diagonal from top-left to bottom-right has the same element.Now given an M x N matrix, return True if and only if the matrix is Toeplitz.Example 1:Input: matrix = [...

2018-04-12 14:27:57 367

转载 LeetCode刷题——Array篇(最大岛屿)

1、Max Area of IslandGiven a non-empty 2D array grid of 0’s and 1’s, an island is a group of 1’s (representing land) connected 4-directionally (horizontal or vertical.) You may assume all four edges ...

2018-04-12 14:19:13 436

翻译 【卡尔曼滤波器-Python】The g-h filter white white noise(白噪声)

用G-H滤波器减少白噪声用G-H滤波器减少白噪声白噪声的模拟不同初值对滤波结果影响白噪声的模拟这里采用numpy.random.randn()函数随机生成期望为0的有限变量,生成的过程即在原始数据上加上随机生成的噪声,定义如下的函数from numpy.random import randndef gen_data(x0,dx,count,noise_factor): return

2016-02-03 14:27:27 4089

翻译 【卡尔曼滤波器-Python】The g-h filter

【卡尔曼滤波器-Python】The g-h filterThe g-h filter是kalman的基本思想。通过经验值来改进测量值,达到滤波的效果。举个例子,假如有一个人有一天的重量是160斤,并且接下来每天的体重都会增加一斤,但是我们通过体重计测得的数据分别如下所示[158.0, 164.2, 160.3, 159.9, 162.1, 164.6,169.6, 167.4, 166.4, 17

2016-01-29 16:52:40 9749

原创 【卡尔曼滤波器-Python】Numpy基本函数

用python实现卡尔曼滤波器

2016-01-29 16:12:34 7580

原创 【OPENCV】基于背景差法的运动目标检测

平台:VS2010+opencv 2.3.11、读取视频数据,并初始化相关的变量,如红框的初始值;2、灰度转化cvCvtColor;3、二值化cvThreshold;4、均值滤波cvSmooth;5、sobel算子cvSobel;6、腐蚀cvErode;7、膨胀cvDilate;8、逐帧比较,找出运动物体的边界;9、在原视频中,将运动物体的边界用红框标出;以

2015-04-23 10:30:48 4403

How NLP Cracked Transfer Learing

The year 2018 has been an inflection point for machine learning models handling text (or more accurately, Natural Language Processing or NLP for short). Our conceptual understanding of how best to represent words and sentences in a way that best captures underlying meanings and relationships is rapidly evolving. Moreover, the NLP community has been putting forward incredibly powerful components that you can freely download and use in your own models and pipelines . One of the latest milestones in this development is the release (https://ai.googleblog.com/2018/11/open-sourcing-bertstate- of-art-pre.html) of BERT (https://github.com/google-research/bert), an event described (https://twitter.com/lmthang/status/1050543868041555969) as marking the beginning of a new era in NLP. BERT is a model that broke several records for how well models can handle language-based tasks. Soon after the release of the paper describing the model, the team also open-sourced the code of the model, and made available for download versions of the model that were already pre-trained on massive datasets. This is a momentous development since it enables anyone building a machine learning model involving language processing to use this powerhouse as a readily-available component – saving the time, energy, knowledge, and resources that would have gone to training a language-processing model from scratch. (It’s been referred to as NLP’s ImageNet moment (http://ruder.io/nlp-imagenet/), referencing how years ago similar developments accelerated the development of machine learning in Computer Vision tasks)

2018-12-04

【OPENCV】基于背景差法的运动目标检测

详情请阅读我的博客,有相关的介绍说明,代码可用

2015-04-23

【OPENCV】图像的预处理(灰度图、二值化、字符矫正(旋转))

主要是图像旋转的算法实现,工程完整,代码详细,并且有相应的博客,可查看我的博客就能看到设计思路

2014-12-17

K-NN(K近邻算法)实现手写字符的识别(C语言)

K-NN(K近邻算法)实现手写字符的识别(C语言)实现,通过VS2010平台验证通过,代码详细易懂,是该算法上手的好资料.

2014-12-08

libSVM的代码详细解析,注释非常详细

台湾林智仁教授所写的SVM的源代码的详细注释,是学习SVM很好的资料

2014-12-08

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除