DeepBrain核心团队是国内第一批AI创业者,曾研发出国内最早的中文语音助手—智能360(2011年)、远场语音交互设备—小智超级音箱(2014年)以及AI云平台。
算力、数据:困扰AI的两大痛点
长期处在AI行业的开发经验,让他们逐渐发现了AI本身固有的痛点:数据和算力,也萌生了用新技术解决问题的想法。
数据方面的问题首先是使用权和拥有权难以分离。AI中任何模型的建立,都离不开海量的数据。数据从哪里来?往往需要从别的公司买,假如一家卖数据的公司,好不容易采集到了很多数据,卖给别人后别人再转卖出去,那么数据就不值钱了。数据的问题在于很难实现数据使用权和拥有权的分离。实际上卖数据的企业是想把使用权卖出去,但不卖拥有权,问题是数据多次复制,他们的拥有权受到了损害。
其次是数据隐私隐私问题。一家卖数据的公司,采集了几百万的数据,但并不代表几百万用户授权给他去卖,往往都是从各种渠道抓取来的,这里面就含有多多少少的用户隐私,法律风险很高。例如Alpha Go的公司Deep Mind,想要开发医疗版的Alpha Go,他们从英国一个组织NHS拿了160万的患者数据,被英国法院判为非法。所以AI行业的一个普遍困扰是:用户不一定同意数据被出售,而AI必须基于海量数据,全部同意很难做,如果没有数据又做不成。虽然大部分数据会做脱敏处理,但是数据传输过程中的数据泄露有时还是无法避免,例如处理数据的公司里有很多技术人员、数据编辑,你怎么知道一些敏感信息会不会泄露呢?核心原因在于中心化的处理方式。