国内常用的大语言模型有哪些

国内常用的大语言模型有哪些

B站:肆十二-的个人空间-肆十二-个人主页-哔哩哔哩视频 (bilibili.com)

博客:肆十二-优快云博客

问答:(10 封私信 / 72 条消息) 肆十二 - 知乎 (zhihu.com)

目前,中国在大语言模型(LLMs)领域有多个较为著名且具有影响力的模型,这些模型在中文处理能力和应用场景方面表现突出。以下是一些中国知名的大语言模型及其特点:

1. 通义千问(Qwen)

  • 开发者:阿里巴巴
  • 简介:通义千问是阿里巴巴推出的系列大语言模型,特别是Qwen2-72B模型在多个评测中表现优异,成为国内外多个榜单的顶级开源大模型之一。该模型在理科和文科任务中均展现出色的性能,适用于工业、金融、医疗等垂直专业场景。
  • 特点:其开源策略使其在学术界和工业界都受到了广泛关注和应用,下载量突破2000万次。

2. 文心一言(ERNIE Bot)

  • 开发者:百度
  • 简介:文心一言是百度基于ERNIE系列模型开发的对话模型,专注于中文自然语言处理。文心一言4.0在阅读理解、数学推理等多项任务中表现卓越,尤
### 国内常用的Embedding模型列表及介绍 #### 1. Word2Vec Word2Vec 是一种流行的词向量表示方法,通过神经网络模型将词语映射到连续的向量空间中。该技术在中国的应用非常广泛,尤其是在中文语料库上的应用效果良好。阿里云提供了预训练好的中文 Word2Vec 模型供开发者使用[^1]。 #### 2. BERT (Bidirectional Encoder Representations from Transformers) BERT 是由 Google 提出的一种双向 Transformer 编码器结构的语言表征模型,在多个 NLP 任务上取得了显著的效果改进。国内多家机构已经针对中文环境优化了 BERT 模型,并发布了多种变体版本,如ERNIE(百度)、MacBERT 和 RoFormer-Sim 等。 #### 3. FastText FastText 是 Facebook AI Research 开发的一个高效学习单词表示和句子分类工具包。它不仅能够捕捉字符级别的特征,还能有效处理稀疏词汇问题。腾讯开源了适用于中文场景下的 fastText 实现,支持多标签分类等功能。 #### 4. GPT系列(Generative Pre-trained Transformer) 虽然最初是由 OpenAI 发布的大规模无监督预训练语言模型,但是国内也有不少团队基于此进行了本地化适配工作。例如华为云推出了鹏城实验室联合开发的支持超大规模参数量的盘古α架构;阿里达摩院也构建了自己的通义万相大模型体系[^2]。 #### 5. ERNIE (Enhanced Representation through kNowledge Integration) 这是百度推出的一款增强版预训练语言理解框架,特别强调融合百科全书式的知识图谱来提升下游任务的表现力。除了标准版外还有专门面向特定领域定制化的子型号可供选择,比如医疗健康方向的 MedCLP 或者法律咨询方面的 Legal-BERT。 ```python import paddlehub as hub module = hub.Module(name="ernie_tiny") # 加载ERNIE tiny模型 texts = ["今天天气真好", "明天会更好"] results = module.get_embedding(texts=texts, use_gpu=False) for result in results: print(result.shape) # 输出每条文本对应的embedding维度 ```
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

肆十二

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值