缺的不是资料，是学习的心-优快云博客

原创一个好用的快速学习的网站

Thetawave.ai 是一个创新的工具，支持将视频链接快速转换为笔记，特别适合时间有限的用户。通过该平台，用户可以轻松总结B站等平台的教学视频内容，提高学习效率。每天提供免费使用额度，方便用户无需额外成本即可体验其功能。访问链接 https://thetawave.ai/auth/signup?ref=ALCNQZ 注册使用，立即体验这一便捷的学习辅助工具。

2025-05-10 14:48:57 252

原创【无标题】

model_args.compute_dtype (比如设置为 torch.bfloat16 或 torch.float16) 控制了模型的计算精度，包括前向传播、损失计算等，梯度等。对于优化器的精度，通常不直接受到影响。优化器（如 Adam、AdamW）的参数更新依然使用 float32 精度。

2025-04-28 02:02:59 219

原创 qwen推理示例代码

huggingface推理qwen2.5-0.5B对话推理代码。

2025-04-08 15:00:47 153

原创 embedding做HDBSCAN

【代码】embedding做HDBSCAN。

2025-04-08 11:44:20 110 1

原创轮廓系数做聚类，枚举

best_k = kprint(f"最佳 k = {best_k}, 得分 = {best_score:.4f}")

2025-04-08 10:27:49 307

原创【无标题】

使用llm训练embedding的时候，要在query后面接上一样的<|endoftext|>

2025-04-01 17:52:32 119

原创 vllm并发太大，导致服务奔溃

GPU KV-cache usage: 接近100%的话就会导致推理失败，注意 KV-cache usage不能过高。Prefix cache usage: 加速推理的，为了尽可能命中前缀缓存，应该尽量将公共的输入部分前置。

2025-03-26 10:19:51 393 1

nextByte()、nextShort()、nextLong()：读取其他数值类型。hasNextDouble()：检查下一个输入项是否为浮点数。nextLine()：读取整行（包括空格，直到换行符）。hasNextInt()：检查下一个输入项是否为整数。next()：读取下一个单词（以空白字符为分隔符）。hasNextLine()：检查是否还有下一行。hasNext()：检查是否还有下一个输入项。nextDouble()：读取下一个浮点数。nextInt()：读取下一个整数。

2025-03-25 21:30:34 148

原创【无标题】

遇到这个报错，可以直接卸载 sphinx。

2025-03-25 09:24:35 115

原创 python开发返回数据格式变元组了，排查半天

可以观察到元组最后以,结尾，很有代表性的错误。返回数据后面带,逗号。

2025-03-21 09:06:06 317

原创跑批限制时间工具

【代码】跑批限制时间工具。

2025-03-07 20:42:48 112

原创 autodl运行模型报错

autodl V100 运行HuaTuo-o1,报错。报错了，是因为gpu资源，改用半精度就解决了。

2025-01-23 17:13:59 1224 2

原创使用qwen作为基座训练分类大模型

训练大模型注意这个必须加上，不加上batch_size>1会报错。

2025-01-23 17:00:04 664

原创 autodl下载huggingface模型使用镜像加速

model-00004-of-00004.safetensors 是你要下载的文件，灵活变动，参考下图内容。FreedomIntelligence/HuatuoGPT-o1-7B 这部分参考下图红框框的内容灵活变动。

2025-01-22 10:38:27 347

原创 jupyter环境使用问题

剪切jupyter文件，打印当前路径还是显示旧的文件夹路径。解决方案使用拷贝，不用剪切。

2024-12-17 17:15:34 125

原创 faiss数据库检索不稳定

faiss数据检索不稳定这个代码不稳定，构建的索引召回结果可能会不稳定，需要。

2024-12-13 15:56:31 275

原创 pandas操作

不可变对象（如整数、浮点数、字符串、元组等）：由于不可变对象无法修改，函数内部对该对象的任何操作都会创建一个新的对象，原始对象不受影响。传递的是对象的引用：当你将一个变量作为参数传递给函数时，实际上传递的是该变量所指向的对象的引用，而不是对象本身或其副本。可变对象（如列表、字典、集合等）：函数内部对对象的修改会直接影响原始对象，因为它们共享同一个引用。

2024-12-11 11:55:11 211

原创 csv文件处理多个字段拼接到同一个字段错误

这种有问题，df[‘b’]或df[‘c’] 其中有一个取值为nan最后得到的结果就是nan，这种明显不符合要求。df[‘a’] = df[‘b’] + ‘字段c’ + df[‘c’]

2024-12-10 16:12:42 128

原创当别人没用用json.dumps保存对象数据的时候，该怎么重新将这些字符串识别为对象

当别人没用用json.dumps保存对象数据的时候，该怎么重新将这些字符串识别为对象。可以使用 ast 参考代码如下。

2024-12-04 11:49:10 108

原创工作感悟241127

当某个想法开始出现的时候，就很难纠正自己。如果再在那里犹犹豫豫，就是在浪费时间hh。

2024-11-27 09:03:33 138

原创生产问题记录-nebula

这周出了一单生产问题，测试环境系统正常运行，但是上线生产之后，系统无数据返回看了生产日志初步定位到是图谱结果没返回执行图谱查询语句报错执行查询的nebula用户无权限。

2024-11-18 11:29:22 220

原创系统学习领域驱动设计-感悟-高尚名词篇

高尚名词高尚名词通俗意思知识消化开发代码过程中的业务理解持续学习团队角度，持续沉淀文档沉淀业务理解，教会更多的新人，不让某些员工掌握知识壁垒

2024-11-08 09:05:38 226

原创 1003-leetcode补打卡最长公共前缀

编写一个函数来查找字符串数组中的最长公共前缀。如果不存在公共前缀，返回空字符串 “”。示例 1：输入：strs = [“flower”,“flow”,“flight”]输出：“fl”示例 2：输入：strs = [“dog”,“racecar”,“car”]输出：“”解释：输入不存在公共前缀。

2024-11-05 00:01:42 212

原创读取csv踩坑

原因：因为df.read_csv（）底层是推理列的取值类型的，要么用户主动指定，要么依靠pd底层自动推理，但是当行数大的时候，如果low_memory = False不开启的话，默认低内存模式，他会随机采样，这样就有可能判断当前列取值为字符串，有可能判断当前列取值为数值。读取csv的时候，强制df.read_csv（‘xx.csv’,low_memory = False）最近在搞评分卡，发现分别使用xlsx和csv读取数据，出现大坑。但是使用df.to_csv之后，得到的新的csv文件。

2024-10-31 10:40:16 227

原创 1002-补打卡-leetcode打卡，有序数组去除重复出现超过2次的元素

不要使用额外的数组空间，你必须在原地修改输入数组并在使用 O(1) 额外空间的条件下完成。说明：为什么返回数值是整数，但输出的答案是数组呢？请注意，输入数组是以「引用」方式传递的，这意味着在函数里修改输入数组对于调用者是可见的。你可以想象内部操作如下:// nums 是以“引用”方式传递的。也就是说，不对实参做任何拷贝// 在函数里修改输入数组对于调用者是可见的。// 根据你的函数返回的长度, 它会打印出数组中该长度范围内的所有元素。i < len;i++) {

2024-10-13 16:42:18 375

原创 leetcode打卡001-约瑟夫问题

从2开始报1 ，与第一趟同一个角度：假设报1的是下标理论上应该是0（第一趟的下标是0），现在的2下标是2，他理论下标是0（引入理论下标是为了喊号到m），但是他在上一趟的实际下标是2，当前理论下标与实际下标之间相差（0，2）为2，就是m，所以 (J(n-1,m)+m)就是这样来的。当n>1时思考一下，下一趟（即递归中的J(n-1,m)）喊1的人在上一趟（即递归中的J(n,m)）中的位置是 (J(n-1,m)+m)%n。而 (J(n-1,m)+m)%n这样是因为有时候m>n,超过了一圈人数，所以得取模。

2024-10-03 10:35:31 463 1

Java后端代码生成器，减少造轮子

空空如也