自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(173)
  • 资源 (1)
  • 收藏
  • 关注

原创 一个好用的快速学习的网站

Thetawave.ai 是一个创新的工具,支持将视频链接快速转换为笔记,特别适合时间有限的用户。通过该平台,用户可以轻松总结B站等平台的教学视频内容,提高学习效率。每天提供免费使用额度,方便用户无需额外成本即可体验其功能。访问链接 https://thetawave.ai/auth/signup?ref=ALCNQZ 注册使用,立即体验这一便捷的学习辅助工具。

2025-05-10 14:48:57 252

原创 图数据库榜单网站

图数据库榜单。

2025-04-30 16:34:09 245

原创 【无标题】

model_args.compute_dtype (比如设置为 torch.bfloat16 或 torch.float16) 控制了 模型的计算精度,包括前向传播、损失计算等,梯度等。对于 优化器 的精度,通常不直接受到影响。优化器(如 Adam、AdamW)的参数更新依然使用 float32 精度。

2025-04-28 02:02:59 219

原创 lora训练超参

【代码】lora训练超参。

2025-04-10 17:31:28 114

原创 qwen推理示例代码

huggingface推理qwen2.5-0.5B对话推理代码。

2025-04-08 15:00:47 153

原创 embedding做HDBSCAN

【代码】embedding做HDBSCAN。

2025-04-08 11:44:20 110 1

原创 轮廓系数做聚类,枚举

best_k = kprint(f"最佳 k = {best_k}, 得分 = {best_score:.4f}")

2025-04-08 10:27:49 307

原创 【无标题】

使用llm训练embedding的时候,要在query后面接上一样的<|endoftext|>

2025-04-01 17:52:32 119

原创 bge M3做融合检索

【代码】bge M3做融合检索。

2025-03-28 11:43:19 211

原创 vllm并发太大,导致服务奔溃

GPU KV-cache usage: 接近100%的话就会导致推理失败,注意 KV-cache usage不能过高。Prefix cache usage: 加速推理的,为了尽可能命中前缀缓存,应该尽量将公共的输入部分前置。

2025-03-26 10:19:51 393 1

原创 牛客读取入参

nextByte()、nextShort()、nextLong():读取其他数值类型。hasNextDouble():检查下一个输入项是否为浮点数。nextLine():读取整行(包括空格,直到换行符)。hasNextInt():检查下一个输入项是否为整数。next():读取下一个单词(以空白字符为分隔符)。hasNextLine():检查是否还有下一行。hasNext():检查是否还有下一个输入项。nextDouble():读取下一个浮点数。nextInt():读取下一个整数。

2025-03-25 21:30:34 148

原创 【无标题】

遇到这个报错,可以直接卸载 sphinx。

2025-03-25 09:24:35 115

原创 python开发返回数据格式变元组了, 排查半天

可以观察到元组最后以,结尾,很有代表性的错误。返回数据后面带,逗号。

2025-03-21 09:06:06 317

原创 跑批限制时间工具

【代码】跑批限制时间工具。

2025-03-07 20:42:48 112

原创 autodl运行模型报错

autodl V100 运行HuaTuo-o1,报错。报错了,是因为gpu资源,改用半精度就解决了。

2025-01-23 17:13:59 1224 2

原创 使用qwen作为基座训练分类大模型

训练大模型注意这个必须加上,不加上batch_size>1会报错。

2025-01-23 17:00:04 664

原创 autodl下载huggingface模型使用镜像加速

model-00004-of-00004.safetensors 是你要下载的文件,灵活变动,参考下图内容。FreedomIntelligence/HuatuoGPT-o1-7B 这部分参考下图红框框的内容灵活变动。

2025-01-22 10:38:27 347

原创 jupyter环境使用问题

剪切jupyter文件,打印当前路径还是显示旧的文件夹路径。解决方案 使用拷贝,不用剪切。

2024-12-17 17:15:34 125

原创 faiss数据库检索不稳定

faiss数据检索不稳定这个代码不稳定,构建的索引召回结果可能会不稳定,需要。

2024-12-13 15:56:31 275

原创 pandas操作

不可变对象(如整数、浮点数、字符串、元组等):由于不可变对象无法修改,函数内部对该对象的任何操作都会创建一个新的对象,原始对象不受影响。传递的是对象的引用:当你将一个变量作为参数传递给函数时,实际上传递的是该变量所指向的对象的引用,而不是对象本身或其副本。可变对象(如列表、字典、集合等):函数内部对对象的修改会直接影响原始对象,因为它们共享同一个引用。

2024-12-11 11:55:11 211

原创 csv文件处理 多个字段拼接到同一个字段错误

这种有问题,df[‘b’]或df[‘c’] 其中有一个取值为nan最后得到的结果就是nan,这种明显不符合要求。df[‘a’] = df[‘b’] + ‘字段c’ + df[‘c’]

2024-12-10 16:12:42 128

原创 当别人没用用json.dumps保存对象数据的时候,该怎么重新将这些字符串识别为对象

当别人没用用json.dumps保存对象数据的时候,该怎么重新将这些字符串识别为对象。可以使用 ast 参考代码如下。

2024-12-04 11:49:10 108

原创 工作感悟241127

当某个想法开始出现的时候,就很难纠正自己。如果再在那里犹犹豫豫,就是在浪费时间hh。

2024-11-27 09:03:33 138

原创 生产问题记录-nebula

这周出了一单生产问题,测试环境系统正常运行,但是上线生产之后,系统无数据返回看了生产日志初步定位到是图谱结果没返回执行图谱查询语句报错执行查询的nebula用户无权限。

2024-11-18 11:29:22 220

原创 系统学习领域驱动设计-感悟-高尚名词篇

高尚名词高尚名词通俗意思知识消化开发代码过程中的业务理解持续学习团队角度,持续沉淀文档沉淀业务理解,教会更多的新人,不让某些员工掌握知识壁垒

2024-11-08 09:05:38 226

原创 1003-leetcode补打卡 最长公共前缀

编写一个函数来查找字符串数组中的最长公共前缀。如果不存在公共前缀,返回空字符串 “”。示例 1:输入:strs = [“flower”,“flow”,“flight”]输出:“fl”示例 2:输入:strs = [“dog”,“racecar”,“car”]输出:“”解释:输入不存在公共前缀。

2024-11-05 00:01:42 212

原创 读取csv踩坑

原因:因为df.read_csv()底层是推理列的取值类型的,要么用户主动指定,要么依靠pd底层自动推理,但是当行数大的时候,如果low_memory = False不开启的话,默认低内存模式,他会随机采样,这样就有可能判断当前列取值为字符串,有可能判断当前列取值为数值。读取csv的时候,强制df.read_csv(‘xx.csv’,low_memory = False)最近在搞评分卡,发现分别使用xlsx和csv读取数据,出现大坑。但是使用df.to_csv之后,得到的新的csv文件。

2024-10-31 10:40:16 227

原创 1002-补打卡-leetcode打卡,有序数组去除重复出现超过2次的元素

不要使用额外的数组空间,你必须在 原地 修改输入数组 并在使用 O(1) 额外空间的条件下完成。说明:为什么返回数值是整数,但输出的答案是数组呢?请注意,输入数组是以「引用」方式传递的,这意味着在函数里修改输入数组对于调用者是可见的。你可以想象内部操作如下:// nums 是以“引用”方式传递的。也就是说,不对实参做任何拷贝// 在函数里修改输入数组对于调用者是可见的。// 根据你的函数返回的长度, 它会打印出数组中 该长度范围内 的所有元素。i < len;i++) {

2024-10-13 16:42:18 375

原创 leetcode打卡001-约瑟夫问题

从2开始报1 ,与第一趟同一个角度:假设报1的是下标理论上应该是0(第一趟的下标是0),现在的2下标是2,他理论下标是0(引入理论下标是为了喊号到m),但是他在上一趟的实际下标是2,当前理论下标与实际下标之间相差(0,2)为2,就是m,所以 (J(n-1,m)+m)就是这样来的。当n>1时 思考一下,下一趟(即递归中的J(n-1,m))喊1的人在上一趟(即递归中的J(n,m))中的位置是 (J(n-1,m)+m)%n。而 (J(n-1,m)+m)%n这样是因为有时候m>n,超过了一圈人数,所以得取模。

2024-10-03 10:35:31 463 1

原创 neo4j docker 运行4.35 community 版本失败

运行脚本。

2024-09-11 12:28:01 461

原创 Transformer分类

Transformer目前分为三类。

2024-07-23 10:42:11 373

原创 git clone代码失败

Cloning into ‘ragas’…error: RPC failed; HTTP 405 curl 22 The requested URL returned error: 405fatal: expected flush after ref listinggit clone git@github.com:hellostronger/ragas.git

2024-07-10 10:23:28 266

原创 HuatuoGPT2本地运行失败

HuatuoGPT2运行问题

2024-06-26 15:03:35 408

原创 UnicodeDecodeError: ‘utf-8‘ codec can‘t decode byte 0xe6 in position 1023: unexpected end of data

Pycharm Comunity版本间歇性脑抽风,执行代码 debug执行失败,但是run是正常的,报错如下。我的代码路径有中文,试一下把路径中的中文改成英文,出现这个报错几率降低了。

2024-06-20 09:47:55 512

原创 0528-算法岗面试题

算法面试题

2024-05-28 14:38:15 378

原创 0522算法打卡

1、最大质数间隔长度2、最长连续工作多少周

2024-05-22 19:35:30 148

原创 【算法面试题】2024-05-20

算法面试题

2024-05-20 10:33:15 431 1

原创 工作必用的shell命令(会持续更新)

介绍一些工作中必用的shell命令

2024-05-20 08:57:51 147

原创 记录第一次AIGC,通义2.5编写一篇公众号文章

欢迎点击关注,一起追求人文,追求进步。

2024-05-15 00:29:04 135

原创 算法面试题2024-05-11

大模型面试题

2024-05-11 11:09:17 663 4

Java后端代码生成器,减少造轮子

springboot+mybatis-plus 生成service、dao、po层

2022-03-09

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除