人工智能_大模型075_AI产品部署和交付05_LeptonAI轻子智能_Ollama大模型_lepton Ai在线模型使用_ollama安装使用_本地模型搭建---人工智能工作笔记0210

添柴程序猿

于 2024-05-23 10:35:21 发布

阅读量293

点赞数 6

CC 4.0 BY-SA版权

分类专栏：深度/机器学习&爬虫文章标签：人工智能 LeptonAI轻子智能 ollama AI产品部署和交付

本文为博主原创文章，未经博主添柴程序猿允许不得转载违者追究法律责任。

本文链接：https://blog.youkuaiyun.com/lidew521/article/details/138960862

深度/机器学习&爬虫专栏收录该内容

168 篇文章 ¥19.90 ¥99.00

订阅专栏

超级会员免费看

这篇博客介绍了如何在本地使用C++搭建和部署ChatGLM3大模型，包括量化模型、转换为GGML格式以及通过CMake配置和构建项目。同时，还探讨了Ollama框架，它支持多种热门AI模型的快速部署，可以在Linux环境下运行，提供命令行服务和web界面对接模型。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

然后我们再来看这个在本地搭建一个大模型,这里搭建chatglm3-6b模型

cpp (c++ c plus plus)

纯 C/C++ 实现，无需外部依赖。
针对使用 ARM NEON、Accelerate 和 Metal 框架的 Apple 芯片进行了优化。
支持适用于 x86 架构的 AVX、AVX2 和 AVX512。
提供 F16/F32 混合精度，并支持 2 位至 8 位整数量化。

https://github.com/li-plus/chatglm.cpp

参考这个网址进行搭建.

这里面有描述如何搭建的过程.

部署 chatglm3

git clone --recursive https://github.com/li-plus/chatglm.cpp.git && cd chatglm.cpp

git submodule update --init --recursive

Quant

了解本专栏

超级会员免费看

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

添柴程序猿 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。