玩一玩阿里通义千问开源版，Win11 RTX3060本地安装记录！

最新推荐文章于 2024-09-01 22:21:40 发布

原创

最新推荐文章于 2024-09-01 22:21:40 发布 · 1.3k 阅读

3 ·

CC 4.0 BY-SA版权

文章标签：

#开源 #人工智能 #AI写作

本文记录了在Win11系统，配备RTX3060 12G显卡的电脑上安装和运行阿里开源的通义千问-7B-Chat模型的过程。从创建虚拟环境到解决一系列依赖问题，如transformers、tiktoken、accelerate包的安装，再到显存不足采用4bit量化及遇到的bitsandbytes库不支持Windows的问题。经过一番努力，最终成功在12G显存的设备上运行了模型，并实现了简单的WebUI交互。文章还分享了直接体验通义千问的官方主页链接。

大概在两天前，阿里做了一件大事儿。

就是开源了一个低配版的通义千问模型--通义千问-7B-Chat。

这应该是国内第一个大厂开源的大语言模型吧。

虽然是低配版，但是在各类测试里面都非常能打。

官方介绍：

Qwen-7B是基于Transformer的大语言模型, 在超大规模的预训练数据上进行训练得到。预训练数据类型多样，覆盖广泛，包括大量网络文本、专业书籍、代码等。同时，在Qwen-7B的基础上，我们使用对齐机制打造了基于大语言模型的AI助手Qwen-7B-Chat。本仓库为Qwen-7B-Chat的仓库。

同时官方也给出了很多测试结果。

比如中文评测。

在C-Eval验证集上得分对比：

Model	Avg. Acc.
LLaMA2-7B-Chat	31.9
LLaMA2-13B-Chat	40.6
Chinese-Alpaca-2-7B	41.3
Chinese-Alpaca-Plus-13B	43.3
Baichuan-13B-Chat	50.4
ChatGLM2-6B-Chat	50.7
InternLM-7B-Chat	53.2
Qwen-7B-Chat	54.2