1.项目背景
随着人工智能技术的不断创新和应用,我们可以看到人工智能在各个领域的应用越来越广泛。深度学习技术在图像识别、语音识别、自然语言处理等领域表现出色。机器学习算法的改进将解决更多实际问题,如增强学习、迁移学习和联合学习等,以更有效地处理复杂的数据问题。自然语言处理技术的不断进步,有助于实现更自然的对话和交流方式,在智能客服、虚拟助手、智能翻译等方面有着广泛应用。数据与AI融合是不可阻挡的历史潮流,大数据和AI技术相互激发、相辅相成,共同推进彼此的发展,两把“金钥匙”握手会再次在金融行业掀起高潮。
AIGC类应用是数智融合的典型,底层基础是强大的数据治理能力,预训练语言大模型不断获得高质量数据进行训练、迭代和优化,从而带来远胜以往的智能应用理念。大模型将激活证券行业的非结构化数据,更高效地释放数据价值,应用将渗透到业务前中后段,带来新的生产力升级。大模型的爆发,将金融业带入到了一个全新时代,但同时也给行业带来了一些难题。
2.现状及痛点
2.1 数据安全问题
涉及敏感信息的业务应用,数据隐私是一个不可忽视的问题。部分场景中存在调用LLM API接口服务的情况,不能直接拿取业务数据,需要考虑数据泄露的风险。
2.2 私域数据问题
通用大模型在训练过程中并未接触过企业的私域数据和特定业务场景,因此,它们无法完全满足企业实际需求,也无法优化企业的具体业务流程,需要将其与企业内部的特定知识和数据进行整合。
2.3 实时性问题
大模型通常是基于历史的某个时间点及其以前的数据进行训练和优化的,缺失了部分实时的数据,假如有用户询问有关最新数据的问题,AIGC会生成错误的答案,这就是LLM幻觉问题。并