- 博客(2)
- 收藏
- 关注
原创 Datawhale AI 夏令营- AI+逻辑推理
LLM其实就是large language model,大语言模型。这些模型通过海量文本训练、能识别人类语言、执行语言类任务、拥有大量的参数。GPT、LLaMA、Mistral、BERT等都是LLM,LLM是对训练文本信息的压缩,同时拥有了泛化能力,不同于数据库和搜索引擎,LLM能创造性地生成历史上没有出现过的文本内容。LLM可以进行创作内容、处理和分析数据、自动化任务、智能客服等功能。目前LLM最大的缺陷是经常会生成无中生有的回复,如果你没有对应的专业知识,很容易被带偏。
2024-08-03 14:11:19
936
原创 Datawhale AI 夏令营- 讯飞机器翻译挑战赛task2:baseline代码详解
这张图展示了经典的 RNN 架构,其中每个垂直矩形框都是时间步长 t 的隐藏层,每个这样的层都包含若干神经元,每个神经元对其输入执行线性矩阵运算,然后执行非线性运算(例如 tanh())。语言模型需要计算特定序列中多个单词出现的概率。模型可以在不同的词序之间进行选择,它将通过为每个词分配一个分数的概率函数运行所有词序列来实现这一目标,得分最高的序列是翻译的输出。例如,如果模型采用2-gram,则通过将单词与其前一个单词组合来计算的每个 2-gram 的频率将除以相应的uni-gram的频率。
2024-07-16 14:27:48
1095
1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人