
【大语言模型】
文章平均质量分 95
温欣2030
v:kkiss_heart
展开
-
【LLM_03】自然语言处理基础_1
假设我们有若干条训练数据,其中的输入是某个电脑里面的一些属性,比如说它的一些配置之类的,我们希望能够预测出电脑的价格y。这是一个回归问题,希望神经网络根据输入的数据来拟合一个具体的值。语言模型主要完成的两个工作:1、是能够计算一个词的序列,它成为一句话的概率是多少,即联合概率。看已经有的一个序列,成为合法的一句话的概率是多少?如果假设神经网络当中没有激活函数,也就是每一层的操作只是对上一层的输出,运用一个线性变换。针对上面的问题,接下来提到的就是深度学习、大语言模型所做的word embedding。原创 2023-11-11 15:21:35 · 1441 阅读 · 0 评论 -
【LLM_02】LangChain知识库+Lora微调chatglm2-6b模型+提示词Prompt的使用原则
Prompt是给AI的指令,引导模型生成符合业务场景的响应输出。原创 2023-08-04 20:14:56 · 14331 阅读 · 2 评论 -
【LLM_01】ChatGLM2-6B本地安装与部署(大语言模型)
ChatGLM2-6B是一个开源的、支持中英双语的对话语言模型,基于General Language Model (GLM)架构。自我认知:“介绍一下你的优点”提纲写作:“帮我写一个介绍ChatGLM的博客提纲”文案写作:“写10条热评文案”信息抽取:‘从上述信息中抽取人、时间、事件’垂直领域知识基于私有数据的问答。原创 2023-07-30 13:17:23 · 5146 阅读 · 2 评论