1、交互场景中关键信息的记录:车机交互场景中,或机器人多轮交互场景中,由大模型判断哪些关键信息要记录到记忆库里面。然后实施信息分类记忆。
2、车载使用了0.5B的多模态大模型,做一些车机对话的信息记录,作为上下文加入到后续的对话中,可用上声纹识别识别角色;记录上车的人群,做场景匹配,比如儿童场景;
3、车机场景的训练数据是在外边买的,有资质的数据供应商可采购,可以提需求,如抽烟,打电话,厂商要雇人帮忙录,厂商要采集和标注,也比较贵。他们要租车要找人去做。几万、十几万条。然后我们做扩增。
4、终端计算,在一些终端上能支撑计算的话,云端算力可以释放出来,降低中央成本。

被折叠的 条评论
为什么被折叠?



