大家都在讨论大模型,似乎什么都可以与大模型结合,可当初学者也想上手时,却面临令人头大的词汇,Prompt、Embedding、Fine-tuning,怎么办呢?别担心,本文就用一种有趣的方式让大家认识它们。
首先让我们先了解一下作为人类是如何去使用大模型的。我们可以把大模型当做一个对语言有着出色理解能力的人,我们要做的就是通过文本的输入,让大模型理解我们希望他做什么事情。那么学会向大模型提问,就变成了用好大模型最重要的事情,甚至可以说使用大模型的过程就是向大模型提问的过程。
那么有哪些概念需要我们了解呢?
Prompt
是输入给大模型的文本,用来提示或引导大模型给出符合预期的输出。我们向大模型提问的文本就是提示词,而大模型在理解了我们的提示词后在提示词的下面会给出对应的回答。
Prompt = 提示词 = 人与大模型交互的媒介
打个比方,假如我们是产品经理,大模型是一名研发工程师的话,那么提示词就是需求,产品经理在提需求的时候,需要在需求里面包含背景说明、需求说明、版本要求、方案建议等信息,只有把需求描述得足够清晰,工程师才能够按照需求输出符合要求的代码,提示词就相当于人向大模型提需求时的需求文档。
Token
我们可以经常在大模型的计费说明中看到Token这个词,Token是大模型处理的最小单元,比如英文单词或者汉字。
Token长度 = 与大模型交互时使用的单词、汉字数
不同的人表达同一件事情时,有的人言简意赅几句话就能把事情说得明明白白,而有的人较啰嗦,那么明显啰嗦的人在描述这件事情上消耗的Token就比前面那个人多了很多。