- 博客(44)
- 资源 (4)
- 收藏
- 关注
转载 音高追踪
音高追踪的基本流程如下: 1、将整段音讯讯号切成音框(frames),相邻音框之间可以重叠。 2、算出每个音框所对应的音高。 3、排除不稳定的音高值。(可由音量来帅选,或由音高值的范围来过滤。) 4、对整段音高进行平滑化,通常是使用“中位数滤波器”(median filters)。 由一个音框计算出音高的方法很多,可以分为时域和
2013-01-04 12:20:23
2827
转载 端点检测 end-point detection
"端点测试"(end-point detection,简称EPD)的目标是要决定音讯开始和结束的位置,所以又可以称为 Speech Detection 或是VAD(Voice Activity Detection)。端点侦测在音讯处理与识别中,扮演一个重要的角色。 常见的端点侦测方法与相关的特征参数,可以分为两大类: 1、时域(time domain)的方法:计算量比较
2013-01-04 12:17:55
4121
转载 声音的基本特征
一、音量(volume) 基本上两种方式来计算: 1、每个音框的绝对值总和: volume= Si=1n |si| 其中si 是一个音框的第i个取样点,而n则是每个音框的点数。这种方法的计算较简单,只需要整数运算,适合用于低阶台
2013-01-04 11:08:55
1721
1
转载 声音的一些基本概念
一。声音的基本概念 声音代表了空气的密度随时间的变化,基本上是一个连续的函数,但是若要将此信号储存在电脑里,就必须将此信号数位化。一般而言,当我们将声音储存到电脑的时候,将有一下几个参数需要考虑:1、取样频率(sample rate):每秒钟所取得的声音资料点数,以Hertz(简写Hz)为单位。点数越高,声音品质越好,但是资料量越大,常用的取样频率如下: 1)、8K
2013-01-04 11:04:30
1576
原创 Java JNI 调用C++ API及中文编码问题
Java调用C++可以通过JNI声明native方法进行调用,主要步骤有:1. 声明类及相关nativ方法,加载要调用的C++库package bupt.cist.nlp.ner;public class ChineseNER { static{ System.loadLibrary("CIST_NER"); } public ChineseNER(){ } publ
2012-08-08 12:10:32
1039
原创 Google Speech Recognition(ASR)
Google的语音识别API至今仍未正式发布,没有很详细的开发文档,只提供一个Service 服务。 Google ASR的API需要提供flac格式的音频,格式转换,可以使用ffmpeg库来处理。当中涉及到具体的库有:json,httpclient, httpcore和commons-logging包。具体代码如下:import java.io.*;import java.net.Ma
2012-07-25 10:41:56
3068
转载 NLP常用工具
各种工具包的有效利用可以使研究者事半功倍。以下是NLP版版友们提供整理的NLP研究工具包。同时欢迎大家提供更多更好用的工具包,造福国内的NLP研究。*NLP Toolbox CLT http://complingone.georgetown.edu/~linguist/compling.html GATE http://gate.ac.uk/ Natural La
2012-07-06 15:47:26
1446
转载 linux用户通信
Unix和Linux提供了多种方式让用户相互通信,它允许以文本的方式给某个用户或所有用户传递信息,而信息来源可以是文本文件或直接由键盘输入的内容。(1)使用write发送消息使用write命令可以向任何已登录同一系统的另一位用户发送消息,这时在对方用户终端上就会自动显示出信息,而对方也同样可以使用write 命令来回复消息,这样双方之间就能互相通信了。write命令的格式如
2012-05-13 11:13:03
758
转载 linux解压 tar命令
linux解压 tar命令tar命令tar [-cxtzjvfpPN] 文件与目录 .... 参数: -c :建立一个压缩文件的参数指令(create 的意思); -x :解开一个压缩文件的参数指令! -t :查看 tarfile 里面的文件! 特别注意,在参数的下达中, c/x/t 仅能存在一个!不可同时存在! 因为不可能同时压缩与解压缩。 -z
2012-05-13 10:53:22
416
原创 一年一度的阿里日 祝福阿里
5月10日 阿里日2005年5月10日,阿里日诞生,阿里巴巴有了属于自己的节日。阿里日,为了纪念2003年阿里人抗击非典时所体现的果断、团结、敬业、互助互爱和永不放弃的阿里精神。2003年的那场非典,来得气势汹涌。阿里巴巴一名同事被确诊为非典疑似病人,在杭四百多名阿里员工以及他们的家人朋友近千人从5月7日起开始了为期一个星期的隔离生活。这是阿里巴巴的第一次SOHO!非典
2012-05-10 13:58:43
1469
转载 eclipe 快捷键
eclipe 快捷键Ctrl 1 快速修复(最经典的快捷键,就不用多说了)Ctrl D: 删除当前行Ctrl Alt ↓ 复制当前行到下一行(复制增加)Ctrl Alt ↑ 复制当前行到上一行(复制增加)Alt ↓ 当前行和下面一行交互位置(特别实用,可以省去先剪切,再粘贴了)Alt ↑ 当前行和上面一行交互位置(同上)Alt ← 前一个编辑的页
2012-05-09 17:19:18
581
原创 screen命令
不知大家是否遇到过无意中把后台运行的程序给cut掉的情况... 今天训练CRF模型训练了几个小时,结果不小心把终端给关掉了,CRF训练数据就这么给弄没了....伤 算是学习了,screen命令是个好东西 给个链接:Linux技巧:使用screen管理你的远程会话
2012-05-03 08:40:26
583
原创 CRF++ 工具使用
google主页:http://crfpp.googlecode.com/svn/trunk/doc/index.html文章: CRF分词序列谈 CRF++的简单使用 基于CRF的中文分词 其他CRF工具:FlexCRFs
2012-04-28 11:05:30
1262
转载 神经网络发展
机器学习(Machine Learning)机器学习是人工智能(Artificial Intelligence)的核心。它和统计学有着密不可分的关系。作为对比,让我们先来看一看这两个领域的区别。传统的统计学的特点: 低维数据;数据中有大量噪点(Noise);数据中没有复杂的结构,且所有结构均可以被简化为一个相对简单的模型;面临的主要问题是如何从数据中
2012-04-17 11:06:07
1241
转载 音频编码汇总
PCMU(G.711U)类型:Audio制定者:ITU-T所需频宽:64Kbps(90.4)特性:PCMU和PCMA都能提供较好的语音质量,但是它们占用的带宽较高,需要64kbps。优点:语音质量优缺点:占用的带宽较高应用领域:voip版税方式:Free备注:PCMU and PCMA都能够达到CD音质,但是它们消耗的带宽也最多(64kbps)。如果网络带宽比较
2012-04-13 10:43:04
830
原创 各大IT公司2012校园招聘笔试面试整理--解题报告整理
百度移动终端研发工程师笔试题,题量不大,2个小时,有点难度。1.写一个字符串逆序的程序,时间复杂度和空间复杂度最低,效率越高越好。void reverse(char* str){ char* begin = str; char* end = s; while (*end != '\0') end ++ ; end --;
2012-04-10 22:36:15
1628
转载 判断是否是2的N次方——证明x & (x - 1)==0的正确性
判断一个整数x是否是2的N次方。 方法之一是判断x & (x - 1)==0。若为True,则x是2的N次方;若为False,则x不是2的N次方。 有人质疑,他证明了“2的n次方一定符合这个条件”, 却并没有证明“符合这个条件的一定是2的n次方”呀!更没有证明“不符合条件的一定不是2的n次方”呀。 现在,从两个方面来证明这个方法的正确性 证明之前,
2012-04-08 13:56:37
785
转载 计算机中的颜色IX——总述:RGB和HSV快速转换
写了一段有关颜色的文章,回顾过去几篇文章,做一个阶段性总结。利用前几篇文章的心得,推导出快速转换RGB模式与HSV模式的公式。 RGB模式:用R、G、B三个颜色的分量来表示颜色,分量的取值范围为[0,255],整数型 HSV模式:用H、S、V三个分量来表示颜色。 分量H:表示颜色的色相,取值[0,360),整数型 分量S:表示颜色的纯
2012-04-08 12:49:11
827
转载 计算机中的颜色VIII——快速计算颜色的偏转
在“计算机中的颜色VII——快速计算纯色的偏转”中介绍了纯色的偏转。 本文对上文的公式进行扩展,扩展到任意的颜色。 颜色(R,G,B)偏转ω后,如何计算偏转颜色(R’,G’,B’) 具体的推导过程不详述了,和前文类似。下面介绍计算过程: 令MAX为R、G、B三个分量的最大值,MIN为R、G、B三个分量的最小值 若MAX=MIN,则颜色为灰度色,无论
2012-04-08 12:47:29
544
转载 计算机中的颜色VII——快速计算纯色的偏转
在颜色的实际使用中,通过更改颜色的色相值改变图片的颜色是常用的方法。 通过更改纯色的色相值称为纯色的偏转,例如:纯色(255,0,0)顺时针偏转60就得到纯色(255,255,0),逆时针偏转60得到纯色(255,0,255)。 那么纯色(255,44,0)顺时针偏转127得到什么颜色呢?下面的文章就是讲述计算方法。 在“计算机中的颜色V——快速计算颜色的色相值”中,
2012-04-08 12:46:32
481
转载 计算机中的颜色VI——从色相值到纯色的快速计算
在上一文中,介绍了“如何快速计算颜色的色相值”,本文介绍从色相值到纯色的计算过程。之前已经介绍,色相值和纯色有着一一对应的关系。先看看传统的计算方法: 从图中计算的过程来看,还是比较繁琐的,再看看之前的纯色色相分布图。 从图中找到规律,在图中的右半部阴影部分,各个分量的变化如下所示: 0-
2012-04-08 12:45:02
681
转载 计算机中的颜色V——快速计算颜色的色相值
在之前的文章中,给定一个颜色,它的色相值计算如下: 由公式可知,计算色相时要分为六种情况,计算略显复杂。有没有简单的计算方法呢?来看看下面这个图 上面这个图,表示纯色的色相分布,把纯色分为六个部分。仔细观察,每个部分的纯色都有统一的特点,例如,右上角的部分,R=255,B=0,G从0变化到255。右边的部分,G=255,B=0,R从255变化到0。每一个部分
2012-04-08 12:43:11
1320
转载 计算机中的颜色IV——纯色、色相色
前一篇文章介绍了颜色的HSV表示方法,其中H表示色相,亦即表示在色相环上的位置。S表示颜色的纯度,当S=1时,表示颜色最纯,当S=0时,表示颜色没有纯度,此时表示为灰度色。V表示颜色的亮度,当V=1,颜色最亮,当V=0时,亮度最低,此时表示颜色为黑色。 综上所述,当一个颜色(H,S,V)中的S=1,V=1时,此时该颜色表示色相环上的一种颜色。我们定义该颜色为纯色或者是色相色。
2012-04-08 12:39:11
2294
转载 计算机中的颜色III——HSV表示方法
在计算机中的实际应用中,除了RGB表示方法外,还有一种用的比较多的表示方法就是HSV(又称HSB)表示方法。它把颜色分为三个参量,一个是色相Hue,具体表示在色相环上的一种纯色,一个是饱和Saturation,具体表示纯色在颜色中的百分比,当S=1时,表示颜色最纯,当S=0时,表示灰度值。一个是亮度Value,表示颜色的亮度,当V=0时,表示黑色。 HSV颜色系统在不破坏图像结构的基础上
2012-04-08 12:31:08
1116
转载 计算机中的颜色II——VB2005中的Color结构
在VB2005中,用来表示颜色的是Color结构,注意是结构,也就是不能继承的。下面把Color结构中的重要属性方法等介绍一下。大部分的资料来源于微软的MSDN。 重要的属性: 颜色的三分量 R:红色的分量,取值范围为0—255 G:绿色的分量,取值范围为0—255 B:蓝色的分量,取值范围为0—255 颜色的类型:
2012-04-08 12:28:33
684
转载 计算机中的颜色I——颜色概述
无论是设计网页还是编写程序,一个美观的界面是必不可少的。仔细分析界面的构成,无外乎两个因素:一是颜色、一个是形状。这个又被称为UI设计。美术功底好的人,是能设计出让人赏心悦目的界面来,欠缺美术功底的人,有时费尽心思也没辙。 这个系列的文章,专注于计算机的颜色表示。通过了解计算机的颜色表示,能有助于提高那些欠缺美术功底的人设计界面的能力。 计算机中的颜色是采用RGB颜色系统,也就
2012-04-08 12:04:09
2033
原创 ArchLinux安装:安装gnome
在上次在VMware上安装ArchLinux后,系统只具备基本的功能,我们可以按自己的需要安装软件。系统更新:1. 确保能连上网,ping www.baidu.com看是否能连通,无法连通可以更改网络配置2. VMware上假如网络连接是靠NAT,在更新系统的时候会出现无法连接的情况,需要设置网络连接为桥接方式, 执行命令 # /etc/rc.d/network restar
2012-04-07 11:23:24
14347
转载 ArchLinux软件安装命令
Pacman包管理器是ArchLinux的一大亮点。它汲取了其他Linux版本软件管理的优点,譬如Debian的APT机制、Redhat的Yum机制、 Suse的Yast等,对于安装软件提供了无与伦比的方便。另外由于ArchLinux是一个针对i686架构优化的发行版,因此对于软件的效率提高也有一定的帮助。pacman可以说是ArchLinux的基础,因为ArchLinux默认安装非常少的软件
2012-04-06 19:16:32
14220
原创 VMware下安装ArchLinux
实验环境: VMware2.6.5 + ArchLinuxArchLinux:http://www.archlinux.org/download/1. 下载ArchLinux core版本,配置虚拟机VMware中的Linux版本选择选项为Other Linux 2.6.x kernel,64位的ArchLinux则选择相应的选项2. 安装ArchLinux 参考Arch
2012-04-06 19:10:39
5974
1
原创 随机数生成器
Park和MIller提供的“最小标准”随机数生成器:#define a 16807#define m 2147483647 // 2^31 -1#define q (m / a)#define r (m % a)static long int seed = 1;/* X <-- (aX + c) mod m; (c = 0) return [1, 214
2012-04-05 21:20:24
1422
原创 C Tips:需要注意的地方
结构体声明:struct classA {...}; // struct classA x1;typedef struct {...} classB; // classB x2;typedef struct classA {...} classC; // classC x3; struct classA x3;classA的定义必须加struct结构标签;用typede
2012-04-05 21:03:53
724
原创 C++疑难问题:const/static
关键字const:指定用其声明的内容保持不变1. 标识变量:代替#define来声明常量const doble PI = 3.14159;2. 标识方法:标识类方法,可以防止方法修改类中不可变的数据成员// class.hclass A{public: int getValue() const;private: int key;};// cl
2012-04-01 17:45:32
343
原创 C++疑难问题:引用
1. 引用变量引用变量在创建时必须初始化,通常,引用是在声明时分配的,不过引用数据成员可以在包含该成员的类的初始化列表中进行初始化。int x = 3;int& xRef = x;int& emptyRef; // does not complie除非引用指向一个const值,否则不能创建指向未命名值的引用。int& unnameRef = 5; // does not c
2012-04-01 17:13:16
2007
原创 论文阅读方式:领域初涉
今天从导师那学习了些论文阅读的方法,为不久的综述报告做准备。简要分享一下。。。首批论文的选择与阅读(30篇左右)目的:通过这一批论文的阅读,能大致了解该领域主题中研究的概貌,明确如下问题在这主题上的重要研究问题有哪些?在这主题上的常用研究方法有哪些?这些方法可以分成哪些主要类别?每个类别的主要优点和缺点是什么?步骤:1. 论文搜索(中英文关键词)
2012-03-30 19:35:58
885
转载 学计算机的,为什么要用linux?
我已经半年没有使用 Windows 的方式工作了。Linux 高效的完成了我所有的工作。GNU/Linux 不是每个人都想用的。如果你只需要处理一般的事务,打游戏,那么你不需要了解下面这些了。我不是一个狂热的自由软件份子,虽然我很喜欢自由软件。这篇文章也不是用来推行自由软件运动的,虽然我觉得自由软件运动是非常好的。这篇文章也不是用来比较 Linux 和 Windows 内核效率,文件系统,网络服务
2012-03-30 15:35:48
1548
转载 NLP语料库索引
中央研究院现代汉语标记语料库(现代汉语平衡语料库):http://www.sinica.edu.tw/SinicaCorpus/ 这是首页。进入中文版,就是这个:http://www.sinica.edu.tw/ftms-bin/kiwi1/mkiwi.sh 中央研究院近代汉语标记语料库:http://www.sinica.edu.tw/Early_Mandarin
2012-03-29 15:45:40
3622
原创 Linux系统相关学习:IP地址邮件自动发送
试验环境: ubuntu10.04 目标:实现一个开机后不用用户登录就自动发邮件报告ip地址的功能,主脚本放在/etc/init.d下,系统默认运行级别为2,所以在 /etc/rc2.d/下建个S99级别的软链接。 具体实现是先用ifconfig获取系统IP信息,保存到/tmp下的一文件IPaddr,然后通过sendmail脚本读取IPaddr文件来发送邮件。 确认脚本都正常工作。
2012-03-28 20:25:24
4582
2
转载 linux系统相关学习:多线程
Linux 多线程函数解析作者: yao_guet (1 篇文章) 日期: 二月 14, 2012 在 5:32 下午Linux多线程函数解析Linux多线程函数用得比较多的是下面的3个pthread_create(),pthread_exit(),pthread_join();它们都是在头文件之中。编译时需要加静态库-lpthread下面是函数的说明: pt
2012-03-28 20:13:07
443
原创 linux 系统相关学习: 系统介绍
话说接触linux系统有三年多了,还记得大一时候在席席他们宿舍看着枞哥玩着ubuntu炫炫的三维立体桌面当时就震惊了,电脑桌面怎么会有这么好的效果!!!!想想当时也是对linux世界的好奇和道听途说的各种强悍(确实)而抱有强烈的探知欲,还没拥有属于自己的一台laptop的时候就各种收集linux相关资料来学习,也算是很有激情的。到实践的时候还得等到我的电脑出世,这里还得感谢色圣帮我安装了传说中那个
2012-03-28 20:10:56
505
原创 linux系统相关学习:Grub2
Grub 2 结构 Grub 2包含下面几个部分:/boot/grub/grub.cfg 文件/etc/grub.d/ 文件夹/etc/default/grub 文件 grub.cfg类似Grub中的 /boot/grub/menu.lst。里面的格式于menu.lst差不多,但是现在不允许你通过直接修改该文件到方式来修改启动项,因为该文件是在 执行"update
2012-03-28 20:08:26
651
数据挖掘算法-聚类-OPTICS
2011-01-02
数据挖据算法 - 聚类DBSCAN
2011-01-02
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人