为什么选择Hugging Face Transformers?核心功能与设计哲学揭秘

0 前言

Transformers,一个包含预训练模型的库,支持自然语言处理、计算机视觉、音频处理和多模态任务,可用于模型推理和训练。可用它在自己的数据上训练模型、构建推理应用,或用LLM生成文本。

访问 Hugging Face Hub,查找模型并开始用Transformers!

1 功能

Transformers 提供用最先进的预训练模型进行推理和训练所需一切工具,主要功能包括:

  • Pipeline:一个简单且经过优化的推理接口,支持多种机器学习任务,如文本生成、图像分割、语音识别、文档问答等。
  • Trainer:一个功能完善的训练器,支持混合精度训练、torch.compile、FlashAttention 等高级特性,适用于 PyTorch 模型的本地和分布式训练。
  • generate:支持大语言模型(LLM)和视觉语言模型(VLM)的快速文本生成,支持流式输出和多种解码策略。

2 设计理念(Design)

可阅读设计哲学(Philosophy) 深入了解 Transformers 核心设计原则。

目标用户是开发者、机器学习工程师和研究人员,其主要设计原则包括:

快速且易于使用

每个模型都由三个核心类(配置类、模型类、预处理类)构建而成,可通过 Pipeline 或 Trainer 快速进行推理或训练。

优先使用预训练模型

通过使用预训练模型,而非从零开始训练新模型,可大幅减少碳排放、计算成本和开发时间。每个预训练模型都尽可能还原原始论文中的实现,具有业界领先的性能表

安装 Hugging Face 的 `transformers` 库是一个相对简单的过程,下面将详细介绍步骤,并提供一些建议确保你能顺利上手。 ### 安装步骤 #### 方式一:通过 pip 直接安装(推荐) 这是最常用也是最简便的方式。只需要打开命令行工具(Windows 用户可以使用 CMD 或 PowerShell;Mac/Linux 用户则可以在终端里操作),然后输入以下指令即可完成最新版本的安装: ```bash pip install transformers ``` 如果你想要同时获取依赖项如 Tokenizers Datasets ,可以用这条命令一次性搞定所有必要的软件包: ```bash pip install transformers[torch] datasets ``` 这里假设你在用 PyTorch 框架做开发工作,如果是基于 TensorFlow 可以换成 `[tf-cpu]` 参数。 #### 方式二:从源码仓库克隆并本地编译安装 对于那些希望参到项目贡献或者需要对某些功能定制化的用户来说,可以从 GitHub 上直接下载最新的代码库再进行编译安装: 1. 克隆官方 Git 仓库: ```bash git clone https://github.com/huggingface/transformers.git cd transformers ``` 2. 创建虚拟环境并激活。(这一步不是强制性的但是强烈建议这样做以免污染全局Python环境) 3. 编辑配置文件修改默认设置(如果有必要的话) 4. 执行 setup.py 文件完成自定义化后的程序部署 5. 验证是否成功加载新版本的功能模块。 注释:此方法更适合有一定经验的技术人员尝试。 --- ### 版本兼容性提示 为了保证最佳性能体验,请务必确认所使用的 Python、PyTorch/TensorFlow 等组件之间相互匹配一致。通常情况下,默认跟随主流稳定版就可以了,除非有特殊需求才会考虑提前尝鲜尚未正式发布的候选版本(candidates release)。 以上就是关于怎样正确安装 Hugging Face Transformer 的全部内容啦~希望能帮到你!
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值