- 博客(4)
- 收藏
- 关注
原创 书生大模型笔记
常规的方法:将文章分块,向量化,然后将问题分块,向量化,去匹配包含相关知识的文章块,然后通过Prompt去询问,让模型回答。(这样可能会丢失文章块的上下文关系,跨文档找逻辑可能会存在问题,原生的支持超长上下文的未来可能会替代RAG的一个方向)不断进行上面的步骤,数据驱动,数据质量很重要。1、最新信息和知识的获取。1、基于规则的数据构造。2、基于模型的数据扩充。3、基于反馈的数据生成。高质量的数据合成数据。
2024-08-13 21:33:09
206
原创 Python task
在这个函数中,我们首先将文本转换为小写,然后创建一个翻译表,该表将所有的标点符号映射为空字符串,即删除它们。方法应用这个翻译表来移除文本中的所有标点符号。最后,我们按空白字符分割处理过的字符串,统计单词出现的次数,并返回结果字典。上述定义了一个wordcount的函数,用于统计英文字符串中每个单词出现的次数,并返回一个字典。通过打断点,可以让我们对该程序进行debug,过程如下图所示。
2024-08-11 18:21:31
351
原创 使用vscode连接远程服务器
3、打开本地的vscode,使用ssh远程连接该开发机,在网页上选择SSH连接。1、在InternStudio上面申请自己的开发机。4、输入ssh的连接名以及密码,连接到远程服务器。5、然后可以打开文件夹,进行开发工作。2、启动自己的开发机。
2024-08-11 16:58:06
615
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人