知识引擎和智能体平台助力大模型落地

部分内容总结如下:

一、企业大模型场景落地的关注点和痛点规划:前期如何规划?

  • 如何统一规划整体架构?

    • 并发支持、响应速度

    • 租用还是自建

    • 算力需求多大

    • 商用还是开源?是否全部采用 DeepSeek R1?

    • 本地还是云端

    • 统一规划还是各自尝试

    • 服务于哪些业务目标

    • 目标

    • 大模型

    • 算力

    • 性能

    • 数据安全性考量

    • 总体多少预算

选型:技术路线怎么选?

  • 如何做合理的技术选型?

  • 对大模型的要求

    • 是不是只要大模型就够了

    • 需要大模型做微调

    • 构建行业大模型

    • 各类场景分别选用什么样的大模型合适

    • DeepSeek R1 适合哪些场景?

  • 落地方法

    • 使用各种 RAG 技术做落地,还是需要融入图技术

    • 问数应该是 Text2SQL,还是 Text2 指标?

落地:如何有好的效果?

  • 如何做到结果可信

    • 如何减少幻觉

    • 如何保证结果可解释

  • 如何做到效果好

    • 为什么换一份数据效果不好

    • 表格、图片效果如何

    • 简单问题可以处理,复杂问题回答不了

    • 可以做混合问答么,问答和问数融合在一起

  • 如何保证数据安全性

    • 数据权限

场景:如何选定高价值场景?

  • 目标用户是谁,有什么痛点?

  • 应该如何找场景?

  • 需要哪些人参与

  • 如何找到高价值场景

  • 业务成熟度如何?

    • 是否高频、重复、标准

  • 数据情况如何?

    • 已有数据,持续迭代情况?

  • 技术成熟度

    • 是否可以支持场景实现?

二、如何在 DeepSeek R1 时代更好地进行智能化转型

  • 价值

    包括成本投入降低、自主决策能力增强、自主可控安全、行业模型推理、蒸馏小模型推理、复用能力沉淀。

  • 优势

    有低训练 & 推理成本、推理能力佳、国产化、强化学习、领域知识蒸馏、低代码工具 。

  • 流程

    从 DeepSeek R1 基础模型出发,经 SFT(有监督微调)和 RF(强化学习 ),利用行业推理数据,先构建带推理能力的行业大模型,再通过 SFT 得到带推理能力的专有蒸馏小模型。

  • 数据

    涉及行业公开数据和私有数据集 。

三、知识构建:构建数据融合的统一语义层

企业数据

  • 企业各类格式文档

  • 企业数据库

  • 企业指标系统

  • 视频 / 图片数据

  • 组织机构数据

  • 外部各类数据(舆情、论文、专利..)

关系构建

数据血缘
  • 根据结构化数据之间的关系,构建数据血缘链路

  • 根据非结构化数据的关系,构建数据血缘关系,包括分片、段落、文档,知识库等

结构化数据图构建
  • 根据元数据梳理自动化构图,比如社交网络、供应链等

非结构化数据
  • 大模型进行实体关系抽取

  • 根据抽取的反馈,大模型微调

  • 基于微调大模型做实体关系抽取

  • 人工校验并入图

  • 视频 / 图片 / 音频:先结构化,再抽取关系

非结构化数据文档段落关系构建
  • 根据段落抽取对应的图

  • 包括分级目录结构

  • 切片前后关系

  • 文档片段与标签的关系

结构化非结构化数据关系构建
  • 组织机构关系

  • 作者与文档、代码、工作项的关系

  • 文档引用关系

  • 根据关系自动构建

以下是PPT内容:关注公众号“会飞的一十六”获取完整版PPT链接

往期精彩

Hive中TABLESAMPLE函数核心使用场景解析

银行业大模型标杆研究--工商银行

王二狗 vs 京东面试官:作为数仓工程师是如何和业务方沟通需求的?需求模糊或存在冲突时,你是怎么处理的?

Hive跨表JOIN性能优化:基于抽样统计的实战解决方案

憨憨雷军 VS 小米数据团队面试官:全量表变增量表,表名还需要区分吗?

3分钟学会Hive中TABLESAMPLE函数用法,轻松搞定数仓中抽样的用法。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值