
AI&Tensorflow
文章平均质量分 80
Holidaylovesam
这个作者很懒,什么都没留下…
展开
-
语音识别基础学习的文章索引
这篇博客整合了一下之前学习语音识别时的所有资料,包括架构、原理、以及一些开源语音识别框架和库的使用,感兴趣的小伙伴也可以一起来练习一下,交流下经验。原创 2021-01-23 19:32:46 · 2482 阅读 · 0 评论 -
机器学习的应用
之前参加过一些机器学习相关的分享课题,了解到一些机器学习在各个场景下的应用,做的一些学习笔记。原创 2019-12-29 21:09:56 · 1020 阅读 · 0 评论 -
语音识别的架构
语音识别的架构语音识别系统语音识别系统是一个先编码后解码的过程,主要包括语音信号的采样和预处理部分、特征参数提取部分、语音识别核心部分以及语音识别后处理部分。可以看下方的架构图。Speech,原始语音信号Feature Extraction,特征抽取,由原始的语音得到语音向量。Acoustic Model、Language Model、Pronunciation Dict...原创 2019-07-27 15:38:26 · 5451 阅读 · 0 评论 -
语音识别的端点检测
端点检测的概念端点检测,也叫语音活动检测,Voice Activity Detection,VAD,它的目的是对语音和非语音的区域进行区分。通俗来理解,端点检测就是为了从带有噪声的语音中准确的定位出语音的开始点,和结束点,去掉静音的部分,去掉噪声的部分,找到一段语音真正有效的内容。在噪声环境下使用语音识别系统,或者讲话人产生情绪或心里上的变化,导致发音失真、发音速度和音调改变,都会产生Lo...原创 2019-07-27 15:38:50 · 21153 阅读 · 1 评论 -
语音信号的采集
语音信号的采集一般的语音来源主要是三种,业内开放的通用训练集数据、特定用户录制的数据,采用TTS技术合成的数据。部分公司会将用户的指令数据进行收集,从而丰富通用训练集,提取高频数据集,Bad Case数据集,专项数据集(方言、中英文混合),特殊场景数据集(导航、电话、音乐等其他应用冲突的场景)等等。在录制和采集语音数据时,业内一般有如下几个指标,这些指标也都和语音识别的原理及架构...原创 2019-07-27 15:38:39 · 6522 阅读 · 0 评论 -
语音识别:声学的要素和特征
声学的基本概念声音,来源于振动的物体,辐射声音的振动物体称之为声源。声波的概念声波,一般用频率和声压两个指标形容。人类的听觉范围为20Hz~20000Hz,即20hz~20kHz,最敏感的是1000hz~3000hz之间的声音。低于人类听觉范围的叫做次声波,高于这个范围的叫做超声波。 声波指标 概念 分类 ...原创 2019-07-27 15:38:04 · 6462 阅读 · 0 评论 -
语音识别的概念和前世今生
最近在学习语音识别的一些知识,做了一些笔记,这篇文章讲讲语音识别的发展,以及相关的几个容易混淆的概念。语音识别的背景从物理声音被转换为电信号,再通过模数转换器转换为数据。一旦被数字化,就可适用若干种模型。语音识别的技术,就是让机器通过识别和理解过程把语音信号转变为相应的文本或命令的技术。发展阶段50年代:贝尔实验室开始语音识别的研究,主要研究基于简单的孤立词的语音识别系...原创 2019-07-24 21:57:01 · 3546 阅读 · 0 评论 -
机器学习的基本概念
下文包含一些机器学习的基本概念,比如监督学习和无监督学习的区别,常见的机器学习算法、模型评估、过拟合和欠拟合等等等等。机器学习的对象是:具有一定的统计规律的数据。机器学习根据任务类型,可以划分为:监督学习任务:从已标记的训练数据来训练模型。 主要分为:分类任务、回归任务、序列标注任务。无监督学习任务:从未标记的训练数据来训练模型。主要分为:聚类任务、降维任务。半监督学习...原创 2019-05-04 15:55:57 · 737 阅读 · 0 评论 -
Google AI专家为你分享 YouTube 推荐系统算法
转自微信公众号:GDG分享嘉宾崔翱翔谷歌上海资深工程师现任职于谷歌机器视觉处理团队,主要参与机器视觉模型的部署和模型的量化,支持 CloudVision, Google Photos, Google Lens, Gmail 等产品的图像处理。复旦大学数学系博士,对机器视觉、人工智能有浓厚兴趣。 我今天要分享的是应用在 Google Play 和 YouTube 两个 Goo...转载 2018-09-05 00:39:49 · 4856 阅读 · 0 评论 -
业内人脸识别的主流科技公司
人脸识别产品已广泛应用于金融、司法、军队、公安、边检、政府、航天、电力、工厂、教育、医疗及众多企事业单位等领域。业内针对人脸识别服务提供的科技公司非常多,简单列举下集中几家知名科技公司。商汤科技核心业务:智慧金融、智慧商业、智慧安防、互联网+ 技术特点:人脸技术、智能监控、图像识别、文字识别、图像及视频编辑、深度学习框架 官网:https://www.sensetime.com/...原创 2019-10-16 16:12:50 · 3294 阅读 · 1 评论 -
AI 图像识别的测试
随着AI 的浪潮发展,AI 的应用场景越来越广泛,其中计算机视觉更是运用到我们生活中的方方面面。作为一个测试人员,需要紧跟上 AI 的步伐,快速从传统业务测试,转型到 AI 的测试上来。而人脸识别作为机器视觉应用场景里最普及常见的一环,因此这一篇结合AI 的架构和核心,以及人脸识别来讲一讲,AI 怎么测试,以及 AI 测试与传统测试的区别和共同点。人脸识别和 AI的关系先了解...原创 2018-05-14 20:02:34 · 18812 阅读 · 0 评论 -
GMIC 2018大会AI 生万物 嘉宾分享摘要
4月26-28日举办的GMIC全球移动互联网大会, AI 生万物人工智能是今年的主旋律。大会的嘉宾有来自全球业界顶尖领袖,李开复、Yann LeCun、Michael Jordan等等重量级嘉宾,针对AI现状与未来、AI技术引用与创新、AI的下一个五年等话题进行讨论与分享。如下为嘉宾的重要分享精华,以及自己的补课内容。AI 的应用领域普及AI+手机 对于华为的AI而言,主要体现在AI定制芯片...原创 2018-05-29 22:52:13 · 1579 阅读 · 1 评论 -
Mac搭建TensorFlow环境踩过的那些坑
安装tensorflow时,输入Pip install tensorflow后出现错误提示,其中红色提示文字:matplotlib 1.3.1 requires nose,which is not installed.matplotlib 1.3.1 requires tornado,,which is not installed.matplotlib 1.3.1 has requirement ...原创 2018-04-17 23:46:11 · 4964 阅读 · 0 评论 -
Tensorflow环境搭建(Mac系统)
1. Python的下载及安装:https://www.python.org/about/详细步骤和配置问题可以参考这篇文章:https://blog.youkuaiyun.com/alice_tl/article/details/767935902. 进入 terminal 终端3. 进行pip安装和验证pip3为python3的package 安装工具,命令如下:$ sudo easy_install p...原创 2018-04-03 19:17:41 · 1308 阅读 · 0 评论 -
机器学习的算法——用最通俗的例子去理解
1、 DT:决策树(Decision Tree)决策树,是树形结构,通过树形结构将各种情况组合都表示出来,每次分割的时候,都将当前的空间一分为二,简单来说就是每个分支进行一次Yes 或 No 的选择,直到所有选择都进行完毕,最终给出正确答案。示例:比如希望根据一个人的性别、年龄、身高和收入来判断,是否要考虑跟他相亲。用决策树可以这样去设计算法:原创 2017-12-04 20:07:16 · 7613 阅读 · 1 评论 -
AI 的架构与核心
泛义上讲人工智能,一般都会和机器学习结合在一起。AI 的架构人工智能的架构分为三层:应用层、技术层和基础层。应用层聚焦在人工智能和各行业各领域的结合。技术层是算法、模型和技术开发。基础层则是计算能力和数据资源。各层架构再进行细分如下:数据收集:获取什么类型的数据,数据可以通过那些途径获取。常见的数据来源是采集、购买或其他方式获取现有数据。比如中山大学的资深...原创 2017-11-18 03:48:13 · 15696 阅读 · 0 评论 -
AI基本概念和应用
AI 的发展势头5.17日美国旧金山Google I/O 大会上,Google CEO 开场就再次强调了公司战略从“Mobile first to AI first”,称 Google 会因此重新思考自己的所有产品,还要把人工智能用到学术研究、医学的层面。所以会议上十几项新产品的宣布,都是在展示 AI 的成果。近一个月内的新闻AI 也是热门。迪拜机场 CEO:AI 时代,机场安检和入...原创 2019-10-19 17:10:41 · 16622 阅读 · 2 评论