大语言模型调研

最新推荐文章于 2025-09-10 06:37:20 发布

原创

最新推荐文章于 2025-09-10 06:37:20 发布 · 824 阅读

0 ·

CC 4.0 BY-SA版权

文章标签：

#语言模型 #人工智能 #自然语言处理

文章介绍了三个中文对话大模型：BELLE基于开源预训练模型优化，仅支持应用形式部署，不支持API；ChatGLM是清华大学的千亿参数模型，支持本地部署，但多轮对话能力有限；ChatYuan提供API访问，支持多轮对话，可在多种设备上推理。

调研目标

1.BELLE
2.ChatGLM
3.ChatYuan

1.BELLE

1.1 简单介绍

BELLE（BE Large Language model Engine），该项目旨在促进中文对话大模型开源社区的发展。其愿景是通过 LLM 引擎为每个人提供帮助。为了实现这个目标，该项目基于开源预训练大语言模型，如BLOOM和LLAMA，进行了中文优化。模型调优过程仅使用由 ChatGPT 生产的数据，而不包含任何其他数据，为中文指令提供更好的支持。

1.2 部署条件

该模型目前只支持应用的形式进行部署，即基于BELLE模型的跨平台离线大语言模型交谈App。使用量化后的离线端上模型配合Flutter，可在macOS（已支持）、Windows、Android、iOS等设备上运行。

macOS

建议使用M1/M2系列芯片配合16G RAM以获得最佳体验。如果推理速度过慢，可能是内存不足，可以尝试关闭其他app以释放内存。8G内存会非常慢。 Intel芯片理论上也可以跑，但是速度较慢。

Windows、Android、iOS

尚未支持。

1.3 是否支持通过API访问

不支持，仅支持通过下载应用的形式使用。下载链接
，且应用不支持多轮对话。

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

kafkabalu

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

多模态大语言模型调研《MM-LLMs: Recent Advances in MultiModal Large Language Models》简要介绍

qq_37261357的博客

04-03

2054

题目：MM-LLMs: Recent Advances in MultiModal Large Language Models论文：https://arxiv.org/pdf/2401.13601.pdf?项目主页：https://mm-llms.github.io/GPT诞生以来，一向以强大的自然语言处理能力而著称，人们试着将大型语言模型（Large Language Models，LLM）的强大推理和生成能力在除文本以外的模态数据上应用起来。例如图像、视频、音频、3D点云等。

大语言模型(LLMs)综合调研

dra_p0p3n's blogs

04-16

4474

通用人工智能就要来了

参与评论您还未登录，请先登录后发表或查看评论

性能实测！BELLE模型全版本对比：从7B到13B最优选择指南

最新发布

gitblog_00546的博客

09-10

841

你是否还在为选择合适的中文大模型而烦恼？参数大小与性能如何平衡？本地部署与云端调用哪个更优？本文通过实测数据对比BELLE模型全版本特性，帮你找到从7B到13B参数规模的最优解决方案。读完本文你将获得：各版本模型性能对比表、不同场景下的选型建议、量化部署教程及实际应用案例。 ## 模型家族概述 BELLE（Be Everyone's Large Language model Engine）是面...

必看！大语言模型调研汇总！！

weixin_40920183的博客

04-10

2974

作者：guolipa @知乎自从ChatGPT出现之后，各种大语言模型是彻底被解封了，每天见到的模型都能不重样，几乎分不清这些模型是哪个机构发布的、有什么功能特点、以及这些模型的关系。比如 GPT-3.0 和 GPT 3.5 就有一系列的模型版本和索引，还有羊驼、小羊驼、骆驼 ......动图封面于是浅浅的调研了一下比较有名的大语言模型，主要是想混个脸熟，整理完之后就感觉清晰多了，又可以轻...

大语言模型(LLMs)综述调研

qq_44579371的博客

08-24

1209

架构选择使用LM目标进行预训练时，casual decoder架构可以实现出色的零样本和少样本泛化能力，并表现出优于其他架构的零样本性能。此外，指令调整和对齐调整已经被证明可以进一步增强大型casual decoder模型的能力。根据scaling law，选择更大模型与更大的数据集能获得更好的表现能力LLMs支持长文本上下文建模，主要原因可归结于以下两点: LLM编码较长文本的能力。一些位置嵌入方法（如RoPE、T5 bias）已经被验证具有一定的Extrapolation capability。

必看！大语言模型调研汇总！！.pdf

08-26

大语言模型调研汇总本文对大语言模型进行了详细的调研，涵盖了基础语言模型、GPT-style 模型、T5-style 模型、GLM-style 模型等多种类型的大语言模型。下面是对这些模型的详细介绍：基础语言模型是指只在大规模...

大语言模型调研汇总，介绍多种模型

08-28

大语言模型调研汇总 大语言模型是近年来深度学习领域的热门研究方向，它们可以处理自然语言处理（NLP）任务，例如文本分类、命名实体识别、机器翻译等。这些模型的出现，使得NLP任务变得更加简单和高效。下面是大...

大语言模型调研汇总.docx

08-31

大语言模型是当前人工智能领域的一个重要研究方向，它们通过在海量文本数据上进行预训练，学习到丰富的语言规律和模式，从而能够执行各种自然语言处理任务。这些模型通常以Decoder-only架构为主，这是因为Decoder...

2023 年热门的大型语言模型 (LLMs)汇总【更新至9月26】

数据饕餮

09-26

1211

整理了一张大语言模型的血缘图谱，如下图所示：图中的大语言模型，都是自己做过评测的，主观了点，但是原汁原味，有好的可以推荐给我。

国内外大语言模型调研（更新到2023.09.12）

m0_46275020的博客

09-12

1387

目前前端平台比较简陋。

2023大模型安全解决方案白皮书

12-06

1222

在当今迅速发展的数字化时代，人工智能技术正引领着科技创新的浪潮而其中的大模型技术则被视为人工智能的一大突破。大模型是指参数量巨大能力强大的人工神经网络模型，以其卓越的表现在自然语言处理、计算机视觉、语音识别等领域赢得了持续的关注和青睐。这些模型的出现，不仅在学术界引起了研究者们的广泛兴趣，也在商业应用领域带来了一系列创新和变革大模型技术的崛起，首要得益于深度学习的发展以及硬件计算能力的提升。深度学...

大语言模型离线推理：LMDeploy 的 Pipeline API 解析

步子哥的博客

07-27

1034

LMDeploy 的 Pipeline API 为大语言模型的离线推理提供了一个强大而灵活的解决方案。通过简洁的接口和丰富的功能，它极大地简化了 LLM 应用的开发过程。无论是内存管理、性能优化，还是高级功能如流式推理和 SLoRA 支持，Pipeline API 都提供了全面的工具集。随着人工智能技术的不断发展，像 LMDeploy 这样的工具将在推动 LLM 应用落地方面发挥越来越重要的作用。

【大模型离线部署】搭建基于大语言模型的本地知识库问答

瓦罗兰特顶级C位的博客

11-04

1049

知识库问答是一种应用广泛的系统，可以在许多领域发挥重要作用。不过以往的系统通常是基于固定规则、相似度检索或者seq2seq模型，这类系统开发成本较高、修改也较为麻烦，尤其在数据准备过程需要耗费大量精力。

本地离线部署Ai大模型的三种方案，含安装教程！

aolan123的博客

10-16

3161

大模型应用开发需要掌握机器学习算法、深度学习框架等技术，这些技术的掌握可以提高程序员的编码能力和分析能力，让程序员更加熟练地编写高质量的代码。包括：大模型学习线路汇总、学习阶段，大模型实战案例，大模型学习视频，人工智能、机器学习、大模型书籍PDF。带你从零基础系统性的学好大模型！观看零基础学习书籍和视频，看书籍和视频学习是最快捷也是最有效果的方式，跟着视频中老师的思路，从基础到深入，还是很容易入门的。以大模型平台应用与开发为主，通过星火大模型，文心大模型等成熟大模型构建大模型行业应用。

本地离线模型搭建指南-中文大语言模型底座选择依据

Master_Shifu_的博客

06-23

2071

搭建一个本地中文大语言模型（LLM）涉及多个关键步骤，从选择模型底座，到运行机器和框架，再到具体的架构实现和训练方式。以下是一个详细的指南，帮助你从零开始构建和运行一个中文大语言模型。本地离线模型搭建指南将按照以下四个部分展开。

【机器学习】RLHF：在线方法与离线算法在大模型语言模型校准中的博弈

richard_yuu的博客

06-03

1260

RLHF是一种结合人类反馈与强化学习的技术，旨在通过人类反馈来优化语言模型的输出。其基本思想是通过预先训练好的语言模型生成多个候选输出，然后由人类对这些输出进行排序或评分。这些排序或评分作为奖励信号，被用于指导模型在后续生成中“更喜欢”某些结果。通过这种方式，模型可以逐步学会根据人类偏好生成更安全、更准确的输出。提高模型输出的安全性和可信度。通过人类反馈，模型可以学会避免生成不恰当或有害的内容。增强模型对特定任务的理解和执行能力。

使用 Ollama 本地运行各种 LLM

python123456_的博客

05-31

1363

今天看看另外一个产品Ollama。Ollama 的安装非常简单，只需从官网（https://ollama.com/download）下载后解压缩，并在 Terminal 中运行脚本即可完成环境设置。我尝试运行 Llama3，虽然在运行时占用了大量电脑资源，使得其他应用运行变慢，但整体体验尚可。Ollama 支持多种大型语言模型（https://ollama.com/library）。

BELLE-开源中文对话大模型

weixin_41888295的博客

06-03

631

BELLE是一款基于BLOOM和LLAMA的开源中文对话大模型，旨在降低中文大语言模型的研究和应用门槛。本文将介绍BELLE的背景、目标、特点、应用场景和未来发展。

大语言模型的调研与垂直领域微调应用分析

资源摘要信息:"调研大语言模型，以及基于大语言模型在各个垂直领域上进行微调的应用" 在AI（人工智能）领域，大语言模型（LLMs）是一类重要的技术，它代表了自然语言处理（NLP）的前沿研究方向。近年来，随着深度...