- 博客(2)
- 问答 (1)
- 收藏
- 关注
原创 LMCC-A 概念
大语言模型基于Transformer架构,通过海量文本数据预训练,具备强大语言生成、理解和推理能力的模型,参数量通常达数十亿至数千亿级别(如GPT-4、DeepSeek)。核心范式生成范式:根据输入文本(提示)生成连贯、符合语境的文本序列,如对话生成、文章创作;理解范式:分析输入文本的语义、情感、结构等信息,如文本分类、语义相似度计算。与传统NLP模型的区别传统NLP模型:针对单一任务(如情感分析)设计,参数量小(百万至千万级),需人工标注任务数据,泛化能力弱;
2025-11-03 20:43:29
843
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅
1