1 LLM 大模型在工作中的实际应用以及局限性
LLM 大模型工作中实际应用
- 代码 Copilot
- 写正则表达式
- 编写不熟悉的算法
- 编写注释
- 业务代码重构
- 代码 Review
- Code Review
- 测试 Copilot
- 单元测试
- Mock 数据输出
- 运维 Copilot
- 运维脚本
- Linux 指令查询
大模型2点局限性
- 数据时效性:2021年09月前的数据
- 可信性:LLM 大模型的幻觉
如何进一步增加 LLM 大模型的能力?
2 基于大模型和向量数据库的企业级知识库架构剖析
用向量数据库/知识库改进大模型
向量数据库
- 向量是非结构化数据在高维空间中的表征
- Embedding Model 是将非结构化数据映射到高维空间的工具
- 使用合适的 Embedding Model,向量的近似度代表语义的近似度
向量数据库选型
- 国产:Milvus、Tencent Cloud VectorDB、Zilliz Cloud 等
- 海外:Pinecone、Redis、FAISS、PgVector、Elasticsearch Cloud 等
知识库
- 知识图谱
- 全文检索
- 知识库和向量数据库关系:大模型应用离不开向量检索
文档检索增强(Retrieval Augmented Generation)
- 利用提前构建好的知识库,通过检索与 Query 相关的知识片段来增强大模型回答效果