- 博客(5)
- 资源 (1)
- 收藏
- 关注
原创 【动手学大模型3】搭建知识库
由于单个文档的长度往往会超过模型支持的上下文,导致检索得到的知识太长超出模型的处理能力,因此,在构建向量知识库的过程中,我们往往需要对文档进行分割,将单个文档按长度或者按固定的规则分割成若干个 chunk,然后将每个 chunk 转化为词向量,存储到向量数据库中。在检索时,我们会以 chunk 作为检索的元单位,也就是每一次检索到 k 个 chunk 作为模型可以参考来回答用户问题的知识,这个 k 是我们可以自由设定的。它与传统的基于关系模型的数据库不同,它主要关注的是向量数据的特性和相似性。
2025-05-17 10:20:58
718
原创 【动手学大模型2】Prompt 和 LLM API
最初时NLP研究者为下游任务设计出来的一种任务专属的输入模板,类似于一种任务(例如:分类,聚类等)会对应一种 Prompt。在 ChatGPT 推出并获得大量应用之后,Prompt 开始被推广为给大模型的所有输入。
2025-05-15 18:24:12
971
原创 【动手学大模型应用开发1】LLM介绍
本笔记是datawhale大模型应用开发教程https://github.com/datawhalechina/llm-universe的学习笔记。
2025-05-12 20:31:31
603
原创 (Linux服务器)Failed to connect to 127.0.0.1 port 7890: Connection refused 解决git拉取文件时代理问题
参考https://geek-docs.com/git/git-questions/193_git_cannot_find_gitconfig_file.html。参考https://blog.youkuaiyun.com/kids_budong_c/article/details/123479499。,删除和github有关的。
2024-06-02 16:28:10
573
2
原创 Logisim跨文件复制粘贴
提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档Logisim跨文件复制粘贴—加载库将包含需要复制的组件的CIRC文件作为库导入当前文件。然后就可以自由的复制粘贴了。这篇文章写给所有和我一样被这个问题困扰过的人。...
2022-05-29 21:13:38
8675
7
游戏记忆卡片(功能完备,详情见描述)
2021-10-18
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅