
DuerOS 开发
文章平均质量分 95
基于对话式AI操作系统DuerOS,可以高效地实现AI为企业赋能,让AI服务生活
半吊子全栈工匠
半吊子全栈工匠一枚
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
人工智能时代,如何让机器狗听懂你说的话?
【引子】我的专辑《DuerOS 的AI 实战》涵盖了DuerOS应用中较多方向的内容,有点有面,已经有39篇文字,本文是第40篇。四十不惑,如果读者目前还无法掌握DuerOS的应用全貌,或许这一篇文字能给大家提供帮助。如果是一个硬件产品,如何能够通过语音与它交互呢?马上出现在脑海里一个词——人工智能(AI)。实现一个具有人工智能的产品是不是太难了呢?幸运的是,拥有了Du......原创 2022-06-12 20:22:50 · 3182 阅读 · 1 评论 -
智能音箱——多模态交互之DPL 2.0
AI带来的最大改变之一就是人们交互方式的改变。从传统的键盘/鼠标到触摸屏点击操控,终于迎来了智能语音交互。随着智能语音应用逐渐普及和发展,我们仿佛可以捕捉到到智能交互发展轨迹。在一次大会...原创 2020-05-22 07:07:00 · 2385 阅读 · 0 评论 -
如何评测语音技能的智能程度(1)——意图理解
《如何评测语音技能的智能程度》是5篇系列文字,来自一位创业者,也是DuerOS开发者的投稿,老曹尽量不做变动和评价,尽量保持系列文章的原貌,这是第1篇。从事AI-NLP领域已经一年半了,...原创 2020-05-13 07:07:00 · 3429 阅读 · 0 评论 -
如何评测语音技能的智能程度(2)——服务提供
《如何评测语音技能的智能程度》是5篇系列文字,来自一位创业者,也是DuerOS开发者的投稿,老曹尽量不做变动和评价,尽量保持系列文章的原貌,这是第2篇。“你是做什么行业的?”“我是做人...原创 2020-05-26 07:07:00 · 2382 阅读 · 0 评论 -
如何评测语音技能的智能程度(3)——交互流畅
《如何评测语音技能的智能程度》是5篇系列文字,来自一位创业者,也是DuerOS开发者的投稿,老曹尽量不做变动和评价,尽量保持系列文章的原貌,这是第3篇。当用户发起需求后,【意图理解】在前...原创 2020-06-01 07:07:00 · 2560 阅读 · 0 评论 -
如何评测语音技能的智能程度(4)——人格特质
《如何评测语音技能的智能程度》是5篇系列文字,来自一位创业者,也是DuerOS开发者的投稿,老曹尽量不做变动和评价,尽量保持系列文章的原貌,这是第4篇。“若产品能够在人格层面与用户建立关...原创 2020-06-08 07:07:00 · 2682 阅读 · 0 评论 -
从认知负荷理论看语音交互设计
DuerOS Bot Platform 在网站上给出了语音技能的交互设计规范,其中技能话术设计指出了3个原则: 简洁自然 在自然易懂的前提下,应该尽可能的提炼出简洁的技能话术。可以尝试大声并多次重复朗读你的技能话术,直到能够一口气流畅通顺地完成朗读。若表达信息过多,可尝试将话术拆解细分为多轮对话表达。 直白易懂 技能中的话术应该使用日常直白通用的表达方式,避免使用缩略...原创 2020-01-12 21:21:00 · 1924 阅读 · 0 评论 -
调试DuerOS的智能语音技能
进入了智能语音时代,我们都已经熟悉了如何在DuerOS 上开发一个智能语音技能应用,典型的流程如下:在完成代码之后,在上线商用之前,就是我们的日常——技能的调试。对于SaaS或者类AI中台之类的服务,联合调试并不是一件轻而易举的事。在DBP平台上,提供了多种调试的方式,这里简要介绍意图调试,模拟器调试,真机调试,团队调试,还有不可或缺的日志调试。意图调试意图调试是对交互模型的...原创 2020-01-06 20:00:00 · 2352 阅读 · 1 评论 -
DuerOS的零编程技能实现
我们正在步入智能语音时代,而DuerOS正在为生产和生活中的智能语音赋能。开发者可以使用DuerOS提高的Bot SDK,像开发Web应用程序那样完成智能语音技能的开发。从终端用户的视角来看,技能就是一个个具体的智能语音应用;从开发者的视角来看,技能就是支撑智能语音交互的后台应用。程序员改变世界,那么,如何没有编程能力能否实现智能语音应用呢?在DuerOS Bot Platform(...原创 2019-11-17 14:40:32 · 2925 阅读 · 1 评论 -
揭秘“语音交互”背后的AI硬核黑科技!
这是主题为《面向交互的人工智能》的分享。主要讲解了语音交互中用到的 AI 技术,如 ASR、NLU、NLG、TTS 等,以及基于这些细分技术构建的面向对话式的人工智能操作系统——DuerOS。通过本次分享大家可以基本上掌握如何在智能语音交互平台上开发应用,进一步体会智能语音如何服务我们的生活。1语音使人机交互更加便捷什么是交互?交互是指 A 和 B 之间的一系列动作和行为...原创 2019-11-21 21:00:00 · 2473 阅读 · 0 评论 -
DPL 来了——百度2019AI开发者大会DuerOS公开课摘要解读之三
在百度2019AI开发者大会上有很多相对精彩的公开课,DuerOS相关的公开课有4场,分别是: DuerOS技能开发与CFC编程 如何在DuerOS技能中实现用户支付购买 面向多方式交互模型的DPL应用 故事引擎在DuerOS技能开发中的应用 DPL来了, DPL给我们带来了什么呢?本文将摘要解读叶老师分享的“面向多方式交互模型的DPL应用”。...原创 2019-07-10 21:30:00 · 1854 阅读 · 0 评论 -
故事工厂在DuerOS技能开发中的应用——百度2019AI开发者大会DuerOS公开课摘要解读之四...
在百度2019AI开发者大会上有很多相对精彩的公开课,DuerOS相关的公开课有4场,分别是: DuerOS技能开发与CFC编程 如何在DuerOS技能中实现用户支付购买 面向多方式交互模型的DPL应用 故事工厂在DuerOS技能开发中的应用 什么是故事工厂?是一种零编程的DuerOS技能开发工具吗?本文主要解读一下王家乐老师分享的"故事工厂在...原创 2019-07-12 08:00:00 · 1075 阅读 · 1 评论 -
如何在DuerOS技能中实现用户支付购买——百度AI开发者大会中的公开课摘要解读
在百度2019AI开发者大会上有很多相对精彩的公开课,DuerOS相关的公开课有4场,分别是: DuerOS技能开发与CFC编程 如何在DuerOS技能中实现用户支付购买 面向多方式交互模型的DPL应用 故事引擎在DuerOS技能开发中的应用 本文主要解读一下谈老师分享的"如何在DuerOS技能中实现用户支付购买"。购买、支付、计费、对账是一个生态...原创 2019-07-08 21:30:00 · 1259 阅读 · 1 评论 -
智能语音时代,需要了解什么?
技术世界不会让人永远躺在功劳簿上。繁忙之余,感谢愉快的地铁阅读时光,读了一本科普书《智能语音时代》。可能由于译者不是专业人士的缘故,在翻译中有一些常识性错误,例如出现了“网景公司正在奋力开发IE浏览器”之类的,但是瑕不掩瑜,作者还是给出了很多有意思的事实和观点,例如:最好的魔术就是—— 能从逝者那里拿回一些东西, 能让某些东西无中生有, 能让无生命的东西具有...原创 2019-08-07 10:16:38 · 1787 阅读 · 0 评论 -
再看语音交互设计
行动是最好的思维方式。赋能是人工智能对人类最重要的事情,而智能语音(例如DuerOS)正在为人机交互的方式赋能。声音一直是人与人沟通的核心,而今也成为了人机交互的核心——智能语音交互。早在2016年,google声称其搜素请求中有20%是通过语音完成的。但是,语音交互设计并不是新兴的技术,在20多年前老码农刚刚参加工作的时候就可能已经存在多年了。从IVR 系统看起交互式语音问...原创 2019-08-20 22:02:00 · 3034 阅读 · 0 评论 -
百度AI开发者大会之DuerOS 回顾
在7月3日~4日的百度AI开发者大会上, 有很多精彩干货,那么,有哪些与DuerOS相关的内容呢?在主论坛,景老师的主题是“小度小度,开启智能生活新篇章”,搭载DuerOS的智能设备激活数量已达4亿,DuerOS也迎来了5.0。在功能和工具方面具有突破性发展,包括全双工免唤醒、家庭信息流、行业领先的生活习惯和家庭通讯与通知等核心能力。同时,发布了两款新的智能音箱产品。...原创 2019-07-15 07:30:00 · 1472 阅读 · 0 评论 -
对AI产品经理的一知半解
MIT有一个研究表明:每一美元的科研投入,需要100美元与之配套的投资(人、财、物),才能把科研成果转化为产品。而且,从产品到商业变现还需要市场运营推广的投入。对产品的定义随着时光的变迁往往有着不同的内涵,同样的,对产品经理的理解也可能有着不同的认知。关于产品经理的出现在20多年前笔者刚刚参加工作的时候,并没有所谓“产品经理”这样一个岗位。那时候,一个软件产品一般是由ma...原创 2019-12-14 22:22:00 · 1082 阅读 · 0 评论 -
AI开发者大会中的公开课摘要解读——DuerOS技能开发与CFC编程
在百度2019AI开发者大会上有很多相对精彩的公开课,DuerOS相关的公开课有4场,分别是: DuerOS技能开发与CFC编程 如何在DuerOS技能中实现用户支付购买 面向多方式交互模型的DPL应用 故事引擎在DuerOS技能开发中的应用 由于百度云的沈工离开会场较早,很遗憾未能和所有讲师合影。接下来,老码农会对每一个话题的内容进行摘...原创 2019-07-07 22:13:57 · 1133 阅读 · 1 评论 -
企业赋能 AI 服务生活
夏至后的第一个周末,宣武门万豪酒店,2019 WOT 大会的D会场,老码农再次登上了讲台。D会场的主题是智能企业赋能,组委会已经安排好了各位老师分享的内容,于是便宜了我这个所谓出品人和主持人。主要的逻辑是对话式AI操作系统(DuerOS)如何为企业赋能,图像AI技术如何为企业赋能(邵鑫辉老师的分享)。在民生中重要的领域可能有两个,一个教育,另一个是医疗。AI为企业赋能当然首先关注一下这两个领域...原创 2019-06-23 21:38:17 · 1327 阅读 · 0 评论 -
DuerOS 走进初夏的成都
基于DuerOS的技能开发并不是人工智能的研究,而是人工智能技术的落地和具体应用。为了让更多的开发者认识DuerOS,携手百度的开发者中心,我们在成都举行了两天三场的技术沙龙。DuerOS 的技能开发可以零编程基础,对于大学生来说,是我们本次成都之旅的一个积极的尝试, 第一场DuerOS走进校园——曾经有不少的朋友都毕业于成电, 这次实在清水河校区,校园里的咖啡厅让我们注意...原创 2019-06-01 20:55:00 · 8792 阅读 · 47 评论 -
放心用吧!浅谈DuerOS的安全性
“我们每个人都是安全工作者”(参见关于软件开发,都应该知道的10个常识), 这绝不是一句戏言。在人工智能智能领域,安全同样是一个重要的话题。AI操作系统要保证系统的安全性,那么基于AI操作系统的开放平台同样要保证安全性。基于DuerOS 的小度系列音箱是否安全? 基于DuerOS开发的技能服务是否安全呢?小度系列音箱的安全性很多朋友问我,“使用小度音箱是否安全呢?它是不是总在监听...原创 2019-05-22 07:07:00 · 3018 阅读 · 3 评论 -
智能音箱场景下的性能优化
QCon是由InfoQ主办的综合性技术盛会,今年是Qcon举办的第10个年头,半吊子全栈工匠有幸作为演讲嘉宾分享一个近两年来的实践经验——智能音箱场景下的性能优化,隶属于曾波老师出品的“场景化性能优化”专场。作为第二个出场者,前面是字节跳动银国徽老师的高性能弹幕设计解决方案,讲的是数学建模解决性能问题,后面是京东常亮老师的网关性能优化,从宕机引入性能优化的方方面面,最后是腾讯姜...原创 2019-05-14 20:20:00 · 2251 阅读 · 0 评论 -
在校大学生能成为DuerOS 的独立开发者吗?
在校大学生能成为DuerOS 的独立开发者吗?答案是肯定的。在去年百度开发者大会上,中学生都可以成为DuerOS的独立开发者。只要你会用Javascript(nodejs)或者python 编程,有一台可以上网的电脑再加上一个好点子,就可以零成本创建丰富的DuerOS 技能服务,成为一个合格的独立开发者。成为一个DuerOS 独立开发者并发布一个自己的技能非常简单,具体如下:注册登...原创 2019-04-29 07:08:00 · 1475 阅读 · 0 评论 -
生动化你的表达——DuerOS中的SSML应用
在对话式AI系统中,语音交互是主要的输入输出方式。对语音输出而言,有两种主要的方法,一种是事先制作好音频,然后根据用户的请求,播放音频;另一种是通过语音合成中的TTS技术,将文本转化为语音。在很多情况下,制作的音频往往要比语音合成的用户体验要好,因为人的声音中有更多的“色彩”,语音语调中可以有更多的情绪。但是,预先制作的工作量往往较大,而且由于预制的确定性,导致输出内容的动态性较弱。按需定...原创 2019-04-17 21:21:00 · 3497 阅读 · 3 评论 -
用JavaScript打造AI应用-从Nodejs SDK 看DuerOS的技能开发
为什么要掌握JavaScript呢? 使用JavaScript能能否开发AI应用么?答案是肯定的。全栈语言JavaScript就全栈编程语言而言,与python 并驾齐驱的要算是JavaScript了:基于JavaScript的前端框架百花齐放,Vue、React、Angular都有广泛的应用;桌面应用有NW.js(Node +webkit),以及现在的Electron;嵌...原创 2019-04-10 21:21:00 · 4544 阅读 · 3 评论 -
DuerOS春季沙龙:协议与接口的深入浅出
阳春三月,不用去看“江南草长”,四环路边的花都开了。若干年前的北大西南门早已消失在了四环路边,曾经的海淀图书城变成了现在的创业大街。周六的下午,在百度的创新体验中心,举办了DuerOS 核心开发者的交流活动。本次活动涵盖了DBP平台的运营重点和激励方式,产品交互的设计要点,技术讨论和投融资服务四个部分,我主要完成技术部分的分享,现概要如下:原来准备讲一些技能开发中的进...原创 2019-03-24 22:06:31 · 721 阅读 · 1 评论 -
从Java SDK看DuerOS的技能开发
DuerOS是对话式AI系统,既然都已经是人工智能了,为什么还要在DuerOS上开发技能服务呢?温故知新,我们还是要重新审视一下AI,具体可以参见《老码农眼中的简明AI》。从编程的角度看,面向人工智能的应用大约由三部分组成:领域知识、数学算法和计算方式。数学算法和计算已经由类似DuerOS这样的AI系统提供了,但是领域知识涉及到具体的行业知识,业务逻辑,专业术语等等,尤其是业务逻辑,AI系统也...原创 2019-03-22 17:30:00 · 3468 阅读 · 1 评论 -
面向接口/协议?看DuerOS的技能开发
一般地,开发一个对话系统或者机器人问答系统会涉及诸多领域的技术,除了硬件系统之外,还包括语言识别,自然语言处理/识别,知识图谱的搭建,自然语言生成及TTS播报等等,这对于企业及开发者个人而言,几乎是难以完成的任务。有幸的是,对话式AI操作系统例如DuerOS的诞生,使我们可以直面业务逻辑,相对轻松地完成语音类服务的开发与实现。在过去的研发中,经常使用的往往是面向接口的设计方法,那么,面向对...原创 2019-03-07 22:13:21 · 4161 阅读 · 8 评论 -
感知自然语言理解(NLU)
AI即人工智能是一个令人着迷的领域,尤其是基于对话式AI系统的智能音箱的兴起,使人工智能直接走进了我们的家庭。自然语言是人类的智慧,自然语言处理(NLP)是AI中最为困难的问题之一,而自然语言理解(NLU)也变成了一个主要的问题,充满了魅力和挑战。一介程序员,没有能力去做相关的研究,但是认知其中的一些基本概念,对于开发具体NLP/NLU相关的应用实现,尤其是对话式智能系统上的应用,还是非常...原创 2019-03-03 21:36:00 · 4891 阅读 · 5 评论 -
感知人工智能操作系统
AI即人工智能的又一波浪潮来了。机器学习,深度学习,神经网络,语音识别,图像识别...... 常常充斥我们的耳目。不论是AI赋能产业,还是AI改变生活,有的人停留于想象,有的人却在付诸实践。人工智能如何应用落地呢?回忆过往,我们是如何在PC或者智能手机上开发应用的呢?其中很重要的一点就是我们拥有了计算机操作系统,从DOS到Windows,从各种Unix到各种Linux,从Symbian...原创 2019-02-26 15:00:00 · 12291 阅读 · 2 评论 -
智能音箱来了,语音交互设计的一点认知
语音用户界面(或VUI)是一种交互模型,在该模型中,人与机器进行交互,并至少部分通过使用语音来执行一组任务。实际上,这种方式的交互式语音应答(IVR)系统在银行业和旅游业中已经得到了广泛的应用。这些系统主要依赖于语音生物识别来识别用户并使用语音作为主要交互模式完成的任务集。随着亚马逊Echo、苹果的siri 等产品的诞生,VUI发生爆炸,各大公司也开始尝试多媒体交叉设备的体验。“治学先...原创 2019-01-23 21:36:00 · 2964 阅读 · 1 评论