人工智能
文章平均质量分 59
openlabx.org.cn
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
IBM watsonx.data:解锁企业数据价值,构建AI就绪的数据存储平台
在数据驱动决策的时代,企业面临着数据孤岛、管理复杂、成本高昂以及难以满足AI和分析需求的巨大挑战。IBM watsonx.data 应运而生,它是一个专为人工智能(AI)和分析工作负载设计的,旨在提供一个开放、统一且高性能的数据访问与管理平台。原创 2025-08-06 07:37:41 · 2686 阅读 · 0 评论 -
Dify接入Ollama模型环境(安装插件和配置DeepSeek模型)
选择LLM,在Model Name中输入模型名称,在Base URL中输入Ollama的URL,点击 Save 按钮。如果浏览器是中文,并且登录选择 简体中文,界面就是中文。本文当时写文档/截图时用的英文LINUX,所以是英语。在Ollama 插件安装弹出消息框上 点击 install。登录dify系统,见之前 的文章 登录Dify系统。滑动鼠标找到ollama,并点击 install。点击model箭头,系统显示已经安装的模型名称。安装完成后,点击 close。点击右上角的“D”图标,原创 2025-08-06 07:20:22 · 1382 阅读 · 1 评论 -
登录Dify系统
成功安装dify,可参考之前发的 “使用Docker 在Rocky Linux 9.5上在线安装Dify”输入账户(邮箱)和密码,点击登录。原创 2025-08-06 07:04:23 · 3706 阅读 · 0 评论 -
llm-d:面向Kubernetes的高性能分布式LLM推理框架
基于硬件差异(算力/内存/成本)、工作负载特性(QoS/SLO)和实时流量(QPS/请求形状分布),动态计算并部署最优的实例组合(Prefill/Decode/容忍延迟组)。在特定测试中,相比基线,llm-d平均TTFT降低约3倍(S1),或在满足P95 TTFT <=2s SLO下,QPS提升50%(S2)甚至翻倍(S3)。基于vLLM增强的遥测数据,智能地将请求路由至拥有相关KV缓存(尤其是共享前缀)的副本,显著提升缓存命中率,降低首令牌延迟(TTFT)。原创 2025-06-05 07:25:16 · 2021 阅读 · 0 评论 -
NVIDIA GPU Operator 和OpenShift AI系列 通过web控制台安装NFD Operator
2、确保节点特性发现(Node Feature Discovery)在openshift-nfd项目中列出,并且状态为InstallSucceeded(安装成功)。如果安装稍后成功并显示InstallSucceeded(安装成功)消息,您可以忽略失败(Failed)消息。_2、从可用操作符列表中选择节点特性发现(Node Feature Discovery),然后点击安装(Install)。_1、导航到操作符(Operators)→ 已安装操作符(Installed Operators)页面。原创 2025-01-30 07:38:16 · 333 阅读 · 0 评论
分享