- 博客(4)
- 收藏
- 关注
原创 RAG(检索增强的生成式模型)项目的搭建
embeddings=self.embedding_fn(documents), # 每个文档的向量。RAG(Retrieval Augmented Generation),通过检索的方式增强生成模型的能力。query--> 检索-->prompt-->LLM-->回复。同一个语义,用词不同,可以导致检索不到有效的信息。其中,前三部是离线操作的,需要再系统上线前做好。''' 检索向量数据库 '''且OpenAI的向量模型是支持跨语言的。图中左侧是对话的结果,右侧是检索的结果。# 向向量数据库总添加文档。
2024-07-04 11:39:29
2541
原创 torch的cuda相关函数
返回GPU中tensor峰值分配内存。返回当前tensor占用的显卡大小。pytorch中关于cuda的的一些常用函数。作用查看GPU是否可用。
2024-06-23 22:00:16
249
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人