数据饕餮
高级数据产品专家,人工智能等前沿技术领域探索者,15年+一线IT行业经验,主要从事金融、互联网广告和电商行业数据产品建设。
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
大模型推理引擎选型与应用场景分析:SGLang、Ollama、VLLM 和 LLaMA.cpp
在当下的大模型技术生态中,SGLang、Ollama、VLLM 和 LLaMA.cpp 各具特色,适用于不同的应用场景和用户需求。:支持 Windows/macOS/Linux,简单命令即可运行 1700+ 模型(如 Llama、Qwen)1518。:支持 2-bit 到 8-bit 量化,7B 模型可在树莓派运行(0.1 token/s)1517。通过结合自身需求与工具特性,用户可以最大化利用这些技术的潜力,推动 AI 应用的落地与创新。:可调整模型参数(如创造性、系统提示)适配不同任务1315。原创 2025-04-08 08:01:43 · 454 阅读 · 0 评论 -
deepseek r1从零搭建本地知识库10:嵌入模型和知识库建设
嵌入模型是一种将文本、图像、音频等非结构化数据转化为**低维稠密向量(Dense Vector)**的算法模型,这些向量(通常几百到几千维)能够捕捉数据的语义信息。核心目标:将抽象内容转化为计算机可理解的数值形式,同时保留其语义关联性原创 2025-02-16 17:47:23 · 2740 阅读 · 2 评论 -
deepseek r1从零搭建本地知识库11:嵌入模型-跟着榜单去选型
2.1 MTEB 是什么?定位:权威的文本嵌入模型性能评测基准,覆盖检索(Retrieval)、分类(Classification)、聚类(Clustering)、语义相似度(Semantic Similarity)等 8 大类任务、58 个子任务。数据:涵盖 112 种语言,支持多语言模型横向对比。更新频率:排行榜定期更新,收录最新开源和商业模型。2.2 如何使用该排行榜?查看模型排名:默认按综合得分()排序,可点击表头按特定任务(如检索)排序。筛选模型。原创 2025-02-16 17:42:23 · 1023 阅读 · 0 评论 -
deepseek r1完全本地部署实战教程10
Ollama使用环境变量来进行配置,允许用户根据需要调整其行为。通过合理配置这些环境变量,用户可以优化Ollama的性能、安全性以及功能适应性,使其更好地服务于特定的应用场景或开发需求。原创 2025-02-08 09:15:17 · 459 阅读 · 0 评论 -
deepseek r1完全本地部署实战教程09
【代码】deepseek r1完全本地部署实战教程09。原创 2025-02-08 09:50:58 · 422 阅读 · 0 评论 -
DeepSeek R1完全本地部署实战教程01-课程大纲
11.DeepSeek r1 外部访问身份认证api-key。12.DeepSeek r1 公网服务发布-内网穿透设置。8.DeepSeek r1 本地模型路径设置。9.DeepSeek r1 本地访问身份认证。5.DeepSeek r1配置外部网络访问。6.DeepSeek r1多任务并发配置。7.DeepSeek r1 访问性能优化。(1)deepseek r1 模型获取。(2)deepseek r1 模型配置。(1)webui可视化界面部署。(2)ollama安装和配置。4.webui安装和配置。原创 2025-02-10 15:52:49 · 625 阅读 · 0 评论