缺的不是资料，是学习的心-优快云博客

原创 ms-swift训练的感悟2

query: apos：[A]neg:[B,C]1x(2+1) =3 //待入官方公式，对上了因为他最后都是point2point的，可以看出来输入一个query和多个docs 请求reranker的时候还是通过推理 query-doc 来解决的至于listwise ，也只是拿到point2point的loss后再编排而已，怎么编排让point2point的效果更好。

2025-12-06 19:41:39 381

原创使用ms-swift的一些感悟

传统 Reranker- 最基本的方法，适用于一般的排序任务- 利用生成能力，更适合复杂语义理解- 优化整个排序列表，提升整体排序质量- 结合前两者优势，提供最佳性能在实际应用中，可以根据数据特点和性能要求选择合适的训练方法。

2025-11-27 02:40:41 225 1

原创春暖花开，夏日炎炎

遇到搞心态的同事和团队，还是算逑了吧，这钱不是我该赚的hh。

2025-11-17 23:41:24 119 1

原创沙雕操作之删除了pnpm.lock文件

摘要：手欠删除pnpm.lock文件导致TS项目安装异常，排查半天无果，堪称最狗血开发事故。

2025-11-05 19:35:18 89

原创阿里云docker删镜像失败

安装了两个docker,删除其中一个docker就行。即使是root都还是报权限不足。

2025-10-25 00:15:44 258

这篇文章解释了在Mongoose Schema中使用枚举类型时的一个常见问题。当使用Object.values(CalculateMethodEnum)作为枚举值时，由于TypeScript枚举会同时包含数值和字符串键，导致输出数组混合了数值和字符串值[0, 1, "mean", "median"]，这与Schema中定义的Number类型冲突。正确的做法是使用单独定义的枚举值数组CaculateMethodValues，而不是直接使用Object.values()。

2025-09-04 21:32:58 123

原创 docker回炉重造

知识点1：这个地方域名fastgpt-minio能够访问，是因为docker compose会为每个服务名启动一个DNS,最近在学习fastgpt项目，其中使用docker compose启服务。docker compose文件。如果想改变依赖的镜像源。

2025-08-19 20:33:08 270 1

原创 github下载项目提速

添加完上面配置之后，需要在新窗口重新写git clone，旧窗口可能配置还没生效。使用了v2rayn之后，下载git仓库还是很慢？

2025-08-18 11:24:57 216

原创 mock-pytest测试

想mock触发sqlchemy的异常。

2025-07-04 20:11:14 171

原创你领导给你开通了root权限，但是你不会用？

摘要：sudo su用于将当前用户权限提升至超级用户，无需root密码。适用于管理员授予普通用户sudo权限但不提供root账户的情况。执行sudo su时只需输入当前用户密码，即可获得root权限，解决了普通用户频繁使用sudo前缀的问题，同时保障系统安全（领导无需分享root密码）。该命令在管理员信任用户但需限制root直接访问的场景中尤为实用。

2025-06-28 01:43:20 105

原创 milvus实操踩坑

将脚本下载下来，只要docker run那部分。attu看不到没有创建索引的数据。

2025-06-24 15:43:28 128

原创三十年河东，三十年河西

重新出发了，后端->大模型微调->AIGC。最怕自己能力不足，还在自我安慰。顶峰相见了，以后没得🐟摸了。你需要补不足，补短板。

2025-06-17 00:18:32 133

原创 milvus

https://milvus.io/docs/zh/install_standalone-docker.md

2025-06-16 23:50:09 263

原创一个好用的快速学习的网站

Thetawave.ai 是一个创新的工具，支持将视频链接快速转换为笔记，特别适合时间有限的用户。通过该平台，用户可以轻松总结B站等平台的教学视频内容，提高学习效率。每天提供免费使用额度，方便用户无需额外成本即可体验其功能。访问链接 https://thetawave.ai/auth/signup?ref=ALCNQZ 注册使用，立即体验这一便捷的学习辅助工具。

2025-05-10 14:48:57 6076

原创图数据库榜单网站

图数据库榜单。

2025-04-30 16:34:09 271

原创【无标题】

model_args.compute_dtype (比如设置为 torch.bfloat16 或 torch.float16) 控制了模型的计算精度，包括前向传播、损失计算等，梯度等。对于优化器的精度，通常不直接受到影响。优化器（如 Adam、AdamW）的参数更新依然使用 float32 精度。

2025-04-28 02:02:59 242

原创 lora训练超参

【代码】lora训练超参。

2025-04-10 17:31:28 132

原创 qwen推理示例代码

huggingface推理qwen2.5-0.5B对话推理代码。

2025-04-08 15:00:47 243

原创 embedding做HDBSCAN

【代码】embedding做HDBSCAN。

2025-04-08 11:44:20 272 1

原创轮廓系数做聚类，枚举

best_k = kprint(f"最佳 k = {best_k}, 得分 = {best_score:.4f}")

2025-04-08 10:27:49 373

原创【无标题】

使用llm训练embedding的时候，要在query后面接上一样的<|endoftext|>

2025-04-01 17:52:32 150

原创 bge M3做融合检索

【代码】bge M3做融合检索。

2025-03-28 11:43:19 415

原创 vllm并发太大，导致服务奔溃

GPU KV-cache usage: 接近100%的话就会导致推理失败，注意 KV-cache usage不能过高。Prefix cache usage: 加速推理的，为了尽可能命中前缀缓存，应该尽量将公共的输入部分前置。

2025-03-26 10:19:51 901 1

原创牛客读取入参

nextByte()、nextShort()、nextLong()：读取其他数值类型。hasNextDouble()：检查下一个输入项是否为浮点数。nextLine()：读取整行（包括空格，直到换行符）。hasNextInt()：检查下一个输入项是否为整数。next()：读取下一个单词（以空白字符为分隔符）。hasNextLine()：检查是否还有下一行。hasNext()：检查是否还有下一个输入项。nextDouble()：读取下一个浮点数。nextInt()：读取下一个整数。

2025-03-25 21:30:34 174

原创【无标题】

遇到这个报错，可以直接卸载 sphinx。

2025-03-25 09:24:35 152

原创 python开发返回数据格式变元组了，排查半天

可以观察到元组最后以,结尾，很有代表性的错误。返回数据后面带,逗号。

2025-03-21 09:06:06 336

原创跑批限制时间工具

【代码】跑批限制时间工具。

2025-03-07 20:42:48 159

原创 autodl运行模型报错

autodl V100 运行HuaTuo-o1,报错。报错了，是因为gpu资源，改用半精度就解决了。

2025-01-23 17:13:59 1389 2

原创使用qwen作为基座训练分类大模型

训练大模型注意这个必须加上，不加上batch_size>1会报错。

2025-01-23 17:00:04 891

原创 autodl下载huggingface模型使用镜像加速

model-00004-of-00004.safetensors 是你要下载的文件，灵活变动，参考下图内容。FreedomIntelligence/HuatuoGPT-o1-7B 这部分参考下图红框框的内容灵活变动。

2025-01-22 10:38:27 510

原创 jupyter环境使用问题

剪切jupyter文件，打印当前路径还是显示旧的文件夹路径。解决方案使用拷贝，不用剪切。

2024-12-17 17:15:34 134

原创 faiss数据库检索不稳定

faiss数据检索不稳定这个代码不稳定，构建的索引召回结果可能会不稳定，需要。

2024-12-13 15:56:31 336

原创 pandas操作

不可变对象（如整数、浮点数、字符串、元组等）：由于不可变对象无法修改，函数内部对该对象的任何操作都会创建一个新的对象，原始对象不受影响。传递的是对象的引用：当你将一个变量作为参数传递给函数时，实际上传递的是该变量所指向的对象的引用，而不是对象本身或其副本。可变对象（如列表、字典、集合等）：函数内部对对象的修改会直接影响原始对象，因为它们共享同一个引用。

2024-12-11 11:55:11 230

原创 csv文件处理多个字段拼接到同一个字段错误

这种有问题，df[‘b’]或df[‘c’] 其中有一个取值为nan最后得到的结果就是nan，这种明显不符合要求。df[‘a’] = df[‘b’] + ‘字段c’ + df[‘c’]

2024-12-10 16:12:42 155

原创当别人没用用json.dumps保存对象数据的时候，该怎么重新将这些字符串识别为对象

当别人没用用json.dumps保存对象数据的时候，该怎么重新将这些字符串识别为对象。可以使用 ast 参考代码如下。

2024-12-04 11:49:10 130

原创工作感悟241127

当某个想法开始出现的时候，就很难纠正自己。如果再在那里犹犹豫豫，就是在浪费时间hh。

2024-11-27 09:03:33 154

原创生产问题记录-nebula

这周出了一单生产问题，测试环境系统正常运行，但是上线生产之后，系统无数据返回看了生产日志初步定位到是图谱结果没返回执行图谱查询语句报错执行查询的nebula用户无权限。

2024-11-18 11:29:22 330

原创系统学习领域驱动设计-感悟-高尚名词篇

高尚名词高尚名词通俗意思知识消化开发代码过程中的业务理解持续学习团队角度，持续沉淀文档沉淀业务理解，教会更多的新人，不让某些员工掌握知识壁垒

2024-11-08 09:05:38 243

原创 1003-leetcode补打卡最长公共前缀

编写一个函数来查找字符串数组中的最长公共前缀。如果不存在公共前缀，返回空字符串 “”。示例 1：输入：strs = [“flower”,“flow”,“flight”]输出：“fl”示例 2：输入：strs = [“dog”,“racecar”,“car”]输出：“”解释：输入不存在公共前缀。

2024-11-05 00:01:42 271

原创读取csv踩坑

原因：因为df.read_csv（）底层是推理列的取值类型的，要么用户主动指定，要么依靠pd底层自动推理，但是当行数大的时候，如果low_memory = False不开启的话，默认低内存模式，他会随机采样，这样就有可能判断当前列取值为字符串，有可能判断当前列取值为数值。读取csv的时候，强制df.read_csv（‘xx.csv’,low_memory = False）最近在搞评分卡，发现分别使用xlsx和csv读取数据，出现大坑。但是使用df.to_csv之后，得到的新的csv文件。

2024-10-31 10:40:16 255

Java后端代码生成器，减少造轮子

空空如也