- 博客(7)
- 收藏
- 关注
原创 Langchain-Chatchat 本地部署
一种利用 langchain 思想实现的基于本地知识库的问答应用,目标期望建立一套对中文场景与开源模型支持友好、可离线运行的知识库问答解决方案。
2025-04-14 19:48:15
1680
原创 Spark on YARN 调优方案
1.2 Executor 资源配置黄金配比公式:总核数 = executor数量 × 单executor核数建议单个Executor内存 = 核数 × 4-8G2.2 内存调优建议避免OOM:增加spark.executor.memoryOverhead大shuffle场景:降低spark.memory.fraction(可到0.4)缓存密集型:提高spark.memory.storageFraction3.2 数据倾斜处理解决方案:加盐处理:key = originKey + “_” +
2025-04-21 19:14:29
1097
原创 数据建模核心原理
数据模型是现实世界数据特征的抽象表示,包含::::::::#mermaid-svg-l4SdsRMAltwevDVS {font-family:"trebuchet ms",verdana,arial,sans-serif;fill:#333;color:#333;color:#333;fill:none;需求分析概念模型逻辑模型物理模型模型评审实施落地验证维护。
2025-04-18 16:46:41
1745
CDH6.3.2安装与集群部署(基于阿里云)
2025-04-15
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅