谁还记得GLM4是什么时候提出的?
1月16日,智谱AI技术开放日(Zhipu DevDay)推出了新一代的基座大模型 GLM-4。
这有之前的介绍,可以回顾下能力
https://zhipuai.cn/devday
距今不到5个月的时间,没想到今天竟然开源了。
短短2个小时的时间,收到了很多人的关注。
这次开放的是GLM-4-9B模型,在语义、数学、推理、代码和知识等多方面的数据集测评中,GLM-4-9B 及其人类偏好对齐的版本 GLM-4-9B-Chat 均表现出超越 Llama-3-8B 的卓越性能。
模型特点
多轮对话能力:GLM-4-9B-Chat 支持多轮对话。
网页浏览和代码执行:具备网页浏览和代码执行功能。
自定义工具调用:支持自定义工具调用(Function Call)。
长文本推理:支持最大 128K 上下文的长文本推理。
多语言支持:支持包括日语、韩语、德语在内的 26 种语言。
模型拓展:还推出了支持 1M 上下文长度(约 200 万中文字符)的 GLM-4-9B-Chat-1M 模型和基于 GLM-4-9B 的多模态模型 GLM-4V-9B
高分辨率多模态能力:GLM-4V-9B 具备 1120 * 1120 高分辨率下的中英双语多轮对话能力,在中英文综合能力、感知推理、文字识别、图表理解等多方面多模态评测中,GLM-4V-9B 表现出超越 GPT-4-turbo-2024-04-09、Gemini 1.0 Pro、Qwen-VL-Max 和 Claude 3 Opus 的卓越性能。
开放模型列表
- GLM-4-9B:基础模型,支持 8K 上下文。
- GLM-4-9B-Chat:对话模型,支持 128K 上下文。
- GLM-4-9B-Chat-1M:对话模型,支持 1M 上下文长度(约 200 万中文字符)。
- GLM-4V-9B:多模态模型,支持 8K 上下文。
评测结果
- 在对话模型典型任务中,GLM-4-9B-Chat 在多个指标上超越了 Llama-3-8B-Instruct 和 ChatGLM3-6B。
- 在长文本能力评测中,GLM-4-9B-Chat 在 LongBench-Chat 上表现优异。
- 在多语言能力测试中,GLM-4-9B-Chat 在多个数据集上展现了良好的性能。
- 在工具调用能力测试中,GLM-4-9B-Chat 在 Berkeley Function Calling Leaderboard 上取得了高分。
- 在多模态能力评测中,GLM-4V-9B 在多个任务上超越了其他模型。
下载地址
项目地址:https://github.com/THUDM/GLM-4
huggingface模型地址:https://huggingface.co/collections/THUDM/glm-4-665fcf188c414b03c2f7e3b7
huggingface国内镜像模型地址:https://hf-mirror.com/models?search=GLM-4
modelscope:https://modelscope.cn/models/ZhipuAI/glm-4-9b-chat/summary
一起来探讨下GLM-4k-9B的能力吧。
如何学习AI大模型?
作为一名热心肠的互联网老兵,我决定把宝贵的AI知识分享给大家。 至于能学习到多少就看你的学习毅力和能力了 。我已将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。
这份完整版的大模型 AI 学习资料已经上传优快云,朋友们如果需要可以微信扫描下方优快云官方认证二维码免费领取【保证100%免费
】

一、全套AGI大模型学习路线
AI大模型时代的学习之旅:从基础到前沿,掌握人工智能的核心技能!
二、640套AI大模型报告合集
这套包含640份报告的合集,涵盖了AI大模型的理论研究、技术实现、行业应用等多个方面。无论您是科研人员、工程师,还是对AI大模型感兴趣的爱好者,这套报告合集都将为您提供宝贵的信息和启示。
三、AI大模型经典PDF籍
随着人工智能技术的飞速发展,AI大模型已经成为了当今科技领域的一大热点。这些大型预训练模型,如GPT-3、BERT、XLNet等,以其强大的语言理解和生成能力,正在改变我们对人工智能的认识。 那以下这些PDF籍就是非常不错的学习资源。
四、AI大模型商业化落地方案
作为普通人,入局大模型时代需要持续学习和实践,不断提高自己的技能和认知水平,同时也需要有责任感和伦理意识,为人工智能的健康发展贡献力量。