- 博客(58)
- 收藏
- 关注
原创 《世界上最神奇的30个经典定律》读书笔记
1、破窗理论 如果有人打坏了一个建筑物的窗户玻璃,而这扇窗户又没有及时维修,别人就可能受到某些暗示性的纵容,去打烂更多的窗户玻璃。 破窗理论助长了几种心理:1)颓丧心理;2)弃旧心理;3)从众心理;4)投机心理。 要杜绝破窗效应,关键是我们如何把握环境的这种暗示和诱导作用。对于影响深远的小过错要进行小题大做的处理,及时修好第一个被打破的窗户。
2016-05-30 10:46:39
4809
原创 人手检测
Visual Geometry Group的Arpit Mittal,Andrew Zisserman和Phil Torr提出一种静态图像检测人手的方法,这一人物比较具有挑战性,因为人手的形状和视角各异,人手可以是打开或闭合的,可以是部分重合的,每个手指的关节不同,可能抓住物体或其他手。 他们使用一种两级假设和分类框架。结合手型、情境、皮肤等进行检测。 项目地址:Hand detection u
2016-05-20 14:59:33
5325
原创 人体姿态估计
Visual Geometry Group的Marcin Eichner,Manuel J.Marin-Jimenez,Andrew Zisserman,Vittorio Ferrari等提出一种静态图像中估计人体姿态的方法,甚至在复杂背景下。图片中的人能在任意位置,穿任意种类的衣服,任意颜色的衣服。唯一的要求是人是直立的并且是正面。项目提供Matlab代码,地址为:human pose estim
2016-05-19 15:50:46
4433
原创 上半身检测
不同于人脸检测,上半身检测的目标是为了检测图像中人体的上半身。这一项目同样来自牛津大学的Visual Geometry Group,项目主页:Upper Body Configuration Detection其首先通过标注了上半身位置的图片进行训练,得到原型配置: 然后进行检测: 项目提供Matlab源码。但有时视频图像中本来就只有上半身,针对这种情况,Manuel J.Marin-Jimen
2016-05-18 11:58:24
4759
1
原创 仿射不变特征检测
这一项目来自牛津大学Visual Geometry Group。其要解决的问题是在任意图像中检测仿射不变特征。 这一技术可以应用在图像识别领域,比如车牌识别、行车记录仪等,这样能放宽对摄像头位置的要求。项目主页:Affine Covariant Features有Linux和Matlb源码。
2016-05-17 12:09:59
4110
原创 基于图像的人数统计
基于图像的人数统计属于模式识别问题,可应用于安防领域。传统的方法包括:1)视频捕获;2)目标提取(背景建模、前景分析)——常见方法有高斯背景建模、帧差法、三帧差法等;3)目标识别(模式识别、特征点分析),如人脸识别,头肩部识别等,OpenCV里可以使用Hear特征、级联分类器来进行特征检测;4)目标跟踪——基本方法有直方图特征匹配和运动目标连续性匹配,OpenCV里可以使用CamShift算法直接对
2016-05-16 17:36:49
15372
5
原创 语音增强噪声类型及评估方法
语音增强属于数字信号处理中的语音信号处理领域。1、简介1.1 噪声类型 语音增强的目的是提高语音信号的质量或可懂度,减少失真。这里主要介绍单麦克风信号语音增强,常见的失真有: (a) 加性声学噪声:就是麦克风在录制语音时同时录制进去的背景环境声音 (b) 声学混响:多径反射引起的叠加效应 (c) 卷积信道效应:导致不均匀或带宽
2016-04-12 09:18:06
8083
1
原创 C++编程规范
关于组织和策略问题0、不要拘泥于小节(了解哪些东西不应该标准化) 类、函数和枚举:LikeThis;变量名:likeThis;私有成员变量名:likeThis_;宏名称:LIKE_THIS。1、在高警告级别干净利落地进行编译2、使用自动构建系统3、使用版本控制系统 最廉价也最流行的版本控制系统是cvs。4、在代码审查上投入关于设计风格5、一个
2016-04-11 09:53:31
1352
原创 我们手机的需求到底是什么
360大神的介入,手机市场一片血海,市场上什么样的手机都有,做手机的什么人都有,我没买过很多手机,玩过其他人的手机,总体感觉就是,没有让人满意的。 以前,诺基亚就是手机,那时的手机的主要功能还是打电话和发短信,有基本的社交属性。然而苹果手机的出现,手机一下子就多出了很多娱乐属性,这其中触摸屏的应用功不可没。我的第一部手机是诺基亚,第二部是小米1,第三部是魅蓝,诺基亚就不说了,
2015-06-26 21:22:18
1831
原创 OV手机无线快门测评
1、功能 通过声波控制手机照相,即将手机相机的快门键分离出来。2、作用 1)防手抖。手机快门键极度影响手机照相的用户体验,因为手机照相极容易手抖,特别是大部分手机相机的快门键都是在下方,用户往往是捏着手机在照相,很容易手抖。 2)解放姿势。拍照再也不用双手接触手机,单手拿手机,另一只手握快门控制,理论上自拍可以摆出任意姿势(只要你能摆得出)
2015-04-20 21:20:40
1227
原创 迅雷与迅雷看看播放器使用体验(四)
以上便是迅雷主界面部分,最后来说说迅雷悬浮窗。9、迅雷悬浮窗是它的logo,一只飞鸟,当开始一个任务时,就会显示连接资源,之后就会显示下载速度,跟主界面正在下载的任务后面的状态一致。 10、将鼠标放在悬浮窗上,则显示正在下载的任务和已完成的任务。 11、左键单击悬浮窗,没反应;左键双击悬浮窗,则跳出
2015-04-20 20:56:38
1018
原创 迅雷与迅雷看看播放器使用体验(三)
5、在迅雷看看播放器中点击“我的”,显示“可能喜欢”和“播放记录”。由于我第一次安装迅雷看看播放器(以前安装过,后来重装系统卸了),所以未能分析出我的观影喜好。可是我刚刚用迅雷看看播放器播过《澳门风云》,按理说播放记录中应该有才对。 在我挑选了一些我喜欢的影片后,迅雷给我推荐了一些影片。推荐这个功能还是不错的,推荐的电影也是大体跟我选的电影风格类似,只是我很奇
2015-04-20 20:45:15
1403
原创 迅雷与迅雷看看播放器使用体验(二)
2、点击任务下PLAY按钮,可以边下边播,但是需要安装迅雷看看播放器。边下边播一般就是为了可以多次观看,这也是快播默认的功能,也就是说用快播播放会将影片下载到一个指定文件夹。边下边播同时兼顾了下载和播放的功能,只是有时有些影片看一遍就不会再看了,这样得定期清理文件夹,否则越存越大。注意在这个界面没有下载按钮,因为迅雷已经有这个下载任务了,现在是边下边播。 在左
2015-04-20 20:33:08
1610
原创 迅雷与迅雷看看播放器使用体验(一)
一、使用体验 1、 双击桌面快捷方式,启动迅雷,显示出主界面和悬浮窗。主界面默认显示正在下载界面,可显示正在下载的任务名、下载任务大小、下载进度和下载状态(图中是暂停)。 左键单击任务,可以试用高速通道,会显示高速通道剩余时间和提升的速度,主界面和悬浮窗都会显示下载速度,试用完毕若想继续加速,则需开通会员。从下载速度看,高速通道会稍快。
2015-04-20 20:18:32
1279
原创 airmusic产品分析报告
1、 产品描述——它是什么 第一眼看到包装盒,上面印着Wi-Fi音频接收器,因为之前玩过蓝牙音箱,以为airmusic也是通过Wi-Fi来接收并播放音乐,看到盒子后面的说明,才明白它只通过Wi-Fi接收音频,然后通过与其连接的音箱来播放音频,所以是一个将传统音箱升级为无线音箱的设备。 它支持AirPlay、DLNA、QPlay三种音频传输协议,能将手机、平板和电
2015-04-20 19:54:13
6947
原创 声波传输设计过程总结二
进入到7月份,开始优化声波传输方案,主要目的是为了提高码率。 v1.7-beta1为四频版,理论上来说,只要带宽足够,任意频都是可以的。 v1.8-beta1开始设计八频版,前面可发送的数据是十六进制的,此时开始调整为八进制。这个版本使用了双线程。 v1.8-beta2优化每次发送的频率数为参数,
2015-04-18 19:28:49
1485
原创 安卓 NDK与JNI
一、简介 Android NDK(Native Development Kit)是一套开发工具,允许Android应用嵌入由C/C++源代码编译来的本地代码(绕过Dalvik虚拟机),通过JNI(Java Native Interface)调用。JNI和Android没有关系,只是一种Java调用Native的机制,第三方应用可以使用JNI完成自己的C动态链接库(.so文件),但
2015-04-09 18:06:00
803
原创 隐马尔科夫模型
一、马尔科夫链 隐马尔科夫模型是语音和语言处理中最重要的机器学习模型,为了正确定义它,首先需要介绍马尔科夫链,或叫显马尔科夫模型。马尔科夫链和隐马尔科夫模型都是有限状态机的扩展。有限状态机是一组状态和状态之间的转换关系,而加权有限状态机定义了状态转换路径的概率,离开一个状态节点的概率和为1。马尔科夫链是加权状态机的一个特例,其输入序列唯一决定了状态机将经过哪些状态。因为它不能表示
2015-04-09 17:56:35
2215
3
原创 声音特征提取:MFCC向量
声音是模拟信号,声音的时域波形只代表声压随时间变化的关系,不能很好的代表声音的特征,因此,必须将声音波形转换为声学特征向量。目前有许多声音特征提取方法,如梅尔频率倒谱系数MFCC、线性预测倒谱系数LPCC、多媒体内容描述接口MPEG7等,其中MFCC是基于倒谱的,更符合人的听觉原理,因而是最普遍、最有效的声音特征提取算法。在提取MFCC前,需要对声音做前期处理,包括模数转换、预加重和加窗。
2015-04-09 17:07:13
21543
1
原创 异常声音检测总结
异常声音检测,顾名思义,就是检测现实生活中的异常声音,如枪声、爆炸声、哭声、尖叫声等,属于公共安全监控的范畴。传统的公共安全监控是用摄像头,但是摄像头只能监控某个固定的场景,而且受光线影响很大,因而在电影中,罪犯只要知道摄像头的位置,就可以很容易地避开摄像头或用布将摄像头遮住。 随着移动互联网的发展,各种可穿戴式的安全产品相继出现,但都是主打定位牌,360儿童手表倒是可以录音,但是需
2015-04-09 16:39:48
10648
1
原创 互联网产品经理找工之旅
一般来说,公司会在上半年招暑期实习生,下半年开始招应届毕业生,当然是走校招流程那种,即网申——笔试——面试——offer。2014年作为应届毕业生的我,看着身边的朋友同学废寝忘食的拿offer,难免不被卷进这个浪潮之中。 由于已经在360实习过,并且可以留下来,所以在别人在海投时我并没有跟风,主要精力还是放在毕业论文上。实习的时候做的是智能算法研发岗,而我心里对产品经理一直充满好
2015-03-01 00:30:38
1414
原创 《周鸿祎自述——我的互联网方法论》读后感
最近读了这本书,总结起来,就是顺应趋势,用户至上,体验为王,免费和微创新这几个关键词。 说白了就是先圈地,后宰羊,互联网都是这种模式,赚钱无非也就两种模式——让愿意付费的人掏钱,让想放广告的人掏钱。这些感觉自己都体会到了,并非通过本书才学习到,所以也没感觉到有什么新的地方。书中一些节选还是蛮有道理的,得分享下。 ”大家都不爱看说明书,都不爱静下心来学习,而且是一
2014-09-12 16:43:04
5844
原创 实习心得
5个月,一个算法,若干篇文档,申请3个专利,认识一堆不错的人,实习收获还是很大的。 声波传输,据我所知,有很多种实现方式,跟3G有WCDMA、TD-SCDMA、CDMA2000是一样的道理,本质上都是在不同的频段通过波来传送信息。 有些声波传输方案用的是超声波(20kHz)以上,这类实现方式需要专门的发送和接收元件或设备,那就讨论了。 我实习所做的东西,就是通过可听见
2014-09-01 11:16:52
1885
原创 Android学习笔记(一)——Android平台简介
Android是一个开放的手机操作系统平台,为移动设备提供了一个包含操作系统、中间件及应用程序的软件叠层架构。1 Android的特性 Android基于Java,它的流行一方面是Google的大力支持,另一方面是由于它自身的特性: 1)应用程序框架:方便重用和替换手机组件 2)Dalvik虚拟机:专为移动设备优化 3)内
2014-04-04 00:46:46
1239
原创 FastICA算法
目前比较成熟的线性盲源分离算法有很多,FastICA是其中之一。1 ICA算法流程(1) 归一化 首先将观测数据x归一化,即减去其均值m=E{x}使其具有零均值。这意味着s也是零均值的。 归一化预处理能简化ICA算法,在估计出归一后的混合矩阵A后,将计算出的分离信号s再加上s的均值A-1m。(2) 白化 在归一化之后,线性变换
2014-03-30 17:26:40
31336
17
原创 独立成分分析
在已知语音信号方向的情况下,波束形成能明显改善语音质量,提高信噪比;然而在实际环境中,人可能是走动的,即使坐立不动,由于身体的扭曲使得语音到达阵列的方向也是变化的,此时波束形成效果受到限制。如果我们能在不知语音信号方向等先验知识的前提下,把混合的语音分离开来,提取感兴趣的语音信号,达到语音增强的目的,这就是独立成分分析(Independent Component Analysis,ICA)。1
2014-03-28 17:25:16
6272
原创 自适应波束形成(五)——Frost波束形成2
上篇是对matlab模拟产生的阵列接收语音进行增强,这篇主要是利用Frost波束形成器对真实信号进行增强。1 测试环境 采集环境为6*3.7*3.4m3的测试室,用恒通DAR2000多路音频采集卡(如图1左),通过D型音频接线口与由烽火PK-080VH微型数字针孔拾音器(如图1右)组成的麦克风阵列相连,采集8路真实语音信号进行语音增强测试。
2014-03-28 16:21:10
6652
5
原创 自适应波束形成(四)——Frost波束形成1
1 算法原理 LCMV波束形成器最优权向量的求解依赖于阵列接收数据的统计知识,即要计算自相关Rx。然而,实际应用中阵列接收数据的自相关是未知的或是时变的,此时约束自适应算法能用来逼近权向量,即Frost波束形成器。 首先,初始化权向量w[0] = C(CHC)-1f,它满足约束条件。然后以一个适当的比例系数朝Rxxw+Cλ 负梯度方向迭代,得到
2014-03-28 15:04:19
12690
7
原创 自适应波束形成(三)——频域宽带LCMV波束形成器
为了将窄带波束形成扩展至宽带,可以使用频域LCMV波束形成器。首先将麦克风阵列各阵元接收到的信号进行时延补偿,做DFT变换到频域,然后在频域内划分子频带,在每个子频带内运用窄带LCVM算法,最后将得到的结果做IDFT逆变换回时域。尽管频域LCMV波束形成器会降低收敛速度,但可以减少计算复杂度。1 算法原理 频域LCMV波束形成器的结构如图1所示。
2014-03-26 14:51:25
17612
23
原创 自适应波束形成(二)——时域窄带LCMV波束形成器
1 算法原理 如果期望信号的到达角和带宽范围已知,那么可以先对阵列接收数据进行时延补偿,使阵列对期望信号的接收保持一致性,然后对阵列系数强加约束条件以自适应的使波束形成器输出能量E{y(t)*y(t)}最小,等效于使输出信号中非期望方向的噪声能量最小,从而达到增强期望方向信号的目的。这就是线性约束最小方差(LCMV)波束形成器。 波束形成器的响应是频率ω和到达角
2014-03-26 14:25:34
15432
16
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人