AI开发
文章平均质量分 94
不会飞的小龙人
不积跬步,无以至千里;不积小流,无以成江海
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
ollama离线部署加载Bge-M3向量模型
摘要:Ollama是一个开源工具(ollama.ai),支持在本地离线运行大语言模型(LLM),适用于数据敏感场景和开发者测试。支持模型包括Llama2、Mistral、CodeLlama等。部署方法包括下载二进制文件或使用安装脚本,通过环境变量配置API访问。集成BGE-M3向量模型时需注意格式兼容性(仅支持GGUF格式),需通过Modelfile导入并使用API调用嵌入功能。BGE-M3适用于多语言检索、语义搜索等场景,通过Ollama的/api/embed端点生成文本向量。相关资源包括模型下载地址和A原创 2025-09-29 20:53:48 · 1311 阅读 · 0 评论 -
ollama离线部署加载Qwen3-0.6b模型
ollama是一个开源工具(ollama.ai),允许用户在 本地设备(无需联网)运行 LLM。终端用户通过ollama低成本体验大模型能力。Qwen3 是 Qwen 系列中的最新一代大型语言模型,提供了一整套密集型和专家混合(MoE)模型。基于广泛的训练,Qwen3 在推理、指令遵循、代理能力和多语言支持方面取得了突破性进展。原创 2025-09-09 20:48:08 · 2108 阅读 · 0 评论
分享