人工智能并行计算,很大程度提升了语言模型的训练速度

2017年,谷歌提出的Transformer模型革新了语言模型的训练方式,采用并行计算,显著提升了训练速度,降低了研发成本。循环智能等NLP技术公司借此机会崭露头角,专注于利用AI提升人与人沟通的能力,优化销售业绩。创始人之一的杨植麟强调,通过调整AI系统的组织架构,可以更好地推动技术落地,并以实际业务成果为导向进行产品研发和优化。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

  循环智能最早的三位创始人陈麒聪、杨植麟与张宇韬相识于清华大学的知识工程实验室,都有一股「用AI创造社会价值」热血。三人都是技术出身,后来因为业务发展循环智能在2018年又引入了另一位擅长技术产品运营「第四把手」揭发。
  自成立以来,杨植麟就是团队核心技术骨干。2016年与2017年他与陈麒聪、张宇韬开始摸索技术的应用方向。
  对新一代AI创业者来说2017年是一个重要的时间节点。
  那一年,谷歌团队在“Attention is All You Need”一文中提出Transformer模型,该模型没有采用卷机网络与以往RNN的时序结构采用编码机制,编码端同时包含语义息(Multi-Head Attention)和位置信息(Positional Encoding),能够并行计算,大大提升了语言模型的训练速度。
  对于专注技术落地的创业者来说这无疑是一项利好消息,能够减少预训练的时间节约研发成本,加速技术与场景的匹配速度。Transformer的现,打破了计算机视觉凭借深度学习在AI创业圈一统天下的垄断局面,使一大批基于NLP技术的创业公司开始崭露头角,循环智能便是其中之一。
  循环智能的主要业务是运用NLP、语音、多模态、大模型等人工智能技术打造「销售科技」方案,帮助企业的销售团队提升销售业绩。
  杨植麟谈道:「我们认为,AI产生价值的过程可以分为几个阶段,而其中一个阶段就是帮助每个人变得更好,提升人的能力,从而提升整个社会的运行效率。这个Vision(愿景)是我们公司成立之初就有的想法。」
  据他介绍,循环智能选择将AI用于「提升人的沟通能力」,也是经过了很长时间的探索,与客户交流、不断迭代才确定。最终,他们抉择的原动力是客户的诉求,以及对整体市场的判断。比如,根据CB Insights的数据统计,2016年销售科技初创企业的投资额就超过了50亿美元,此后逐渐递增。这也表明了市场对这个赛道的信心。
  杨植麟:选择创业,是为了从「组织架构」上解决AI落地难题
  图注:Gartner的销售科技(SalesTech)技术成熟度曲线2021显示,销售赋能一支已经渡过「技术萌芽期」(Innovation Trigger),进入「期望膨胀区」(Peak of Inflated Expectations)
  如前所述,杨植麟认为,AI系统的组织架构会影响产品的能力,而组织架构的灵活设置可以帮助他们以一个更好的模式去推进产品落地。在创业的过程中,杨植麟实现了学术研究与工业落地的双轮驱动模式。比方说,他被 ACL 2019 接收 Transformer-XL 一文,早在发表之前就已应用在了循环智能的 ASR 产品中。
  对于这项基础技术的快速转化,杨植麟引以为豪:
  「在预训练的过程中,我们将技术部署在产品系统上,让它能以实际数据集的运行效果为最终目标,驱动中间的研发过程。在将挖掘系统落地时,系统也是以最终的业务结果为目标进行学习与优化。同时,中间过程又可以迭代出很多AI问题与基础技术,使得之后的产品可以进一步改善。」

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值