深度学习中的模型进展与Hugging Face生态系统探索
1. 模型的惊人进展
近年来,深度学习领域取得了令人瞩目的进展。例如在2022年,出现了许多强大的模型。像Flamingo这样的视觉语言模型可用于少样本学习。同年5月,DeepMind推出了GATO,这是一个多模态模型,可作为强化学习智能体的策略。同一个Transformer模型可以完成多种任务,如聊天、图像描述、玩Atari游戏、控制(模拟)机械臂等,而它“仅”有12亿个参数。
这些进展引发了不同的观点。一些研究人员认为人类水平的AI已近在咫尺,觉得“规模就是一切”,甚至认为某些模型可能“略有意识”。然而,另一些人指出,尽管取得了惊人的进步,但这些模型仍缺乏人类智能的可靠性和适应性,如符号推理能力、基于单个示例进行泛化的能力等。
2. Hugging Face的Transformers库
如今,谈到Transformer就不得不提Hugging Face。这是一家AI公司,构建了一个易于使用的开源工具生态系统,涵盖自然语言处理、计算机视觉等领域。其生态系统的核心是Transformers库,它允许用户轻松下载预训练模型及其对应的分词器,并在需要时在自己的数据集上进行微调。该库支持TensorFlow、PyTorch和JAX(搭配Flax库)。
使用Transformers库最简单的方法是使用 transformers.pipeline() 函数。以下是一个简单的示例:
from transformers import pipeline
classifier = pi
超级会员免费看
订阅专栏 解锁全文
1165

被折叠的 条评论
为什么被折叠?



