- 博客(6)
- 资源 (2)
- 收藏
- 关注
原创 【大模型系列学习笔记】RAG
text-embedding-ada-002(OpenAI,不开源,收费)跨语言能力强,是langchain和llamaindex框架下默认的嵌入模型。microsoft/table-transformer-detection(模型很小,100M)选择标准:找需求相关的语料库进行文本向量转换测试,通过相似语义转换后的向量相似度进行评估。大多数情况下,开源嵌入模型使用效果一般,要提升检索召回率,建议对嵌入模型进行微调。(4)用GPT-4 Vsion生成表格图像描述,并向量化用于检索。用户问:(用户提问)
2025-04-22 00:25:12
350
原创 【大模型系列学习笔记】大模型应用基础1
例如,在生成的回答中设置check point(调用API)加载数据 -> 切片 -> 向量化 -> 向量存储。一般细分领域微调,选择1.5~3B模型足够。对于1.5B模型,100条高质量数据就OK。将私有化数据转化为高质量数据集(核心)很难达到98% 99%,需要后处理。基于现有知识库做问答。
2025-04-21 23:04:16
226
原创 python读取文件夹下所有文件
最近由于项目需要,大致学习了一下python,看了alexhilton的快速入门博客,感觉基本可以读懂python代码了,赞一下!详情见:http://blog.youkuaiyun.com/hitlion2008/article/details/9285785今天试了两种python读取文件夹下文件的方法,记录一下:(1)使用os.listdir{优快云:CODE:176167
2016-07-14 10:27:22
1333
通讯录MFC程序,C++大作业
2014-02-14
密码学Hash算法
2013-03-16
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅
1