
LLM
文章平均质量分 72
钱景景景景景
这个作者很懒,什么都没留下…
展开
-
transformer详解
一个典型的编码器-解码器的结构,类似于sequence-to-sequence这6(可以自己定)个encode,decode在结构上是完全相同的,但是参数不是完全相同的训练的时候,不是训练了一个encode,然后copy 6次,而是6个encode多在训练。原创 2024-01-24 00:38:20 · 957 阅读 · 0 评论 -
向量数据库如何解决大语言模型的“幻觉”问题
这个问题通常指的是大型语言模型在生成文本时过度依赖于训练数据,导致生成的内容过于特定,缺乏广泛的泛化性。: 向量数据库存储了大量的文本数据,包括来自多个领域和主题的文本。这些文本的多样性可以为大型语言模型提供更广泛的语境和知识,有助于模型更好地泛化到未见过的文本。: 使用向量数据库可以采用更丰富的语境表示方式,例如将文本表示为嵌入空间中的向量。通过比较模型生成的向量与数据库中的实际文本向量,可以识别模型输出中的异常情况。: 向量数据库不断更新,可以引入新颖、最新的文本数据,使得模型能够获取最新的信息。原创 2024-01-15 17:21:05 · 970 阅读 · 1 评论 -
大语言模型&向量数据库
文章来源:A Comprehensive Survey on V ector Database:Storage and Retrieval Technique, Challenge [link](https://arxiv.org/pdf/2310.11703.pdf)原创 2024-01-13 14:18:28 · 1725 阅读 · 0 评论