ChatGLM(国内版的chatGPT)

GitHub - THUDM/ChatGLM-6B: ChatGLM-6B:开源双语对话语言模型 | An Open Bilingual Dialogue Language Model

介绍

ChatGLM-6B 是一个开源的、支持中英双语的对话语言模型,基于 General Language Model (GLM)") 架构,具有 62 亿参数。结合模型量化技术,用户可以在消费级的显卡上进行本地部署(INT4 量化级别下最低只需 6GB 显存)。 ChatGLM-6B 使用了和 ChatGPT 相似的技术,针对中文问答和对话进行了优化。经过约 1T 标识符的中英双语训练,辅以监督微调、反馈自助、人类反馈强化学习等技术的加持,62 亿参数的 ChatGLM-6B 已经能生成相当符合人类偏好的回答,更多信息请参考我们的博客

为了方便下游开发者针对自己的应用场景定制模型,我们同时实现了基于 P-Tuning v2 的高效参数微调方法 (使用指南)") ,INT4 量化级别下最低只需 7GB 显存即可启动微调。

不过,由于 ChatGLM-6B 的规模较小,目前已知其具有相当多的局限性,如事实性/数学逻辑错误,可能生成有害/有偏见内容,较弱的上下文能力,自我认知混乱,以及对英文指示生成与中文指示完全矛盾的内容。请大家在使用前了解这些问题,以免产生误解。更大的基于 1300 亿参数 GLM-130B 的 ChatGLM 正在内测开发中。

Read this in English.

更新信息

[2023/03/31] 增加基于 P-Tuning-v2 的高效参数微调实现,INT4 量化级别下最低只需 7GB 显存即可进行模型微调。详见高效参数微调方法

[2023/03/23] 增加 API 部署(感谢 @LemonQu-GIT)。增加 Embedding 量化模型 ChatGLM-6B-INT4-QE。增加配备 Apple Silicon 芯片的 Mac 上 GPU 加速的支持。

[2023/03/19] 增加流式输出接口 stream_chat,已更新到网页版和命令行 Demo。修复输出中

### 中国科学院在ChatGPT相关领域研究成果和项目 #### 研究方向与进展 中国科学院作为国内顶尖科研机构,在自然语言处理(NLP)以及Transformer架构方面进行了深入探索。这些研究不仅涵盖了理论层面的创新,还包括实际应用场景下的技术实现和发展。 #### 大规模预训练模型开发 针对大规模预训练语言模型的研发,中科院计算所等单位已经取得了一系列重要成果。例如,“悟道”系列超大规模预训练模型由北京智源人工智能研究院联合多家高校院所共同研制完成,该模型参数量达到万亿级别,能够支持多种下游任务并展现出强大的泛化能力[^1]。 #### 应用场景拓展 除了基础技术研发外,中科院还致力于推动NLP技术向更多垂直行业的渗透。通过构建特定领域的对话系统和服务平台,实现了从通用型到专业化转变的过程。这其中包括但不限于医疗健康咨询、法律援助问答等多个民生服务领域内的实践案例[^2]。 #### 开放合作生态建设 为了促进整个产业界对于先进AI技术的理解与应用,中科院积极倡导开放共享的理念。一方面加强内部跨学科团队协作;另一方面也鼓励外部企业参与进来形成良好的互动机制。这种模式有助于加速科技成果转化为现实生产力的同时也为后续技术创新提供了源源不断的动力源泉[^3]。 ```python # Python代码示例:展示如何加载预训练的语言模型进行推理 from transformers import AutoModelForCausalLM, AutoTokenizer tokenizer = AutoTokenizer.from_pretrained("THUDM/chatglm-6b", trust_remote_code=True) model = AutoModelForCausalLM.from_pretrained("THUDM/chatglm-6b", trust_remote_code=True).half().cuda() response, history = model.chat(tokenizer, "你好,你是谁?", history=[]) print(response) ```
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值