自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(33)
  • 资源 (2)
  • 收藏
  • 关注

原创 在window10系统64位+python3.10上安装Pytorch3D教程

win10上安装Pytorch3D

2024-11-15 15:26:41 906

原创 chatglm3 lora微调,训练+预测问题总结

ValueError: Tokenizer class ChatGLMTokenizer does not exist or is not currently imported. 如下图。chatglm3没有set_input_embeddings,两个解决方案,推荐方法2。(2)修改load_model_and_tokenizer方法中的model。1.自写set_input_embeddings方法(网上的没试过)transformers版本太旧了,换版本~1.依赖缺啥包就import啥包。

2024-02-05 14:48:01 2672 5

原创 清华多模态大语言模型visualglm部署+微调踩坑记录

本以为微调visualglm能像chatglm3那样最多碰点版本问题,结果发现小坑不断,得不停查资料,而且大佬们大都去看cogvlm了。mp_rank_00_model_states.pt+latest+model_config.json,正是缺了这些web_demo.py跑不了。微调运行后在Linux中始终无法开启deepspeed,然后卡死,说torch_extensions/py310******文件占用之类的问题。因此请用web_demo_hf.py别用web_demo.py,原因后面会讲。

2024-01-10 14:22:26 2727 6

原创 docker 里python的Opencv安装小坑处理

这是你的docker缺少文件了,补上即可。

2025-06-18 11:36:41 184

原创 Windows利用conda安装gpu版本Faiss + Ubuntu源码安装Faiss-gpu 记录(待更新~)

由于在cpu上使用对向量检索算法时,发现面对数据量较大时,批量匹配耗时会显著增加,影响业务整体响应。便尝试使用GPU来实现检索计算,限于本人技术有限,写不出好算法。便取巧利用Faiss-gpu来检索(* ^ ▽ ^ *)以下是安装记录~

2024-11-28 11:46:02 1534 1

原创 安装pointnet踩坑记录(情绪篇)

最近在学点3D的知识,本想搞个pointnet玩玩。结果被bug整得很难受~,虽然最后跑起来了。用到A系列显卡直接炸~~~~~经过测试(A2000、A4000、A30、A100)全炸!你以为是torch问题?还是显卡驱动没弄好?(搞了我一周的大屎坑)RTX型号没问题比如2080Ti。

2024-08-09 18:27:40 262

原创 windows安装可以读取中文路径中文标签的labelimg

python3.10及以上版本以后安装labelimg容易出现读中文路径闪崩。建议安装版本为3.6.8,labelimg版本为1.8.3。没了~以下是小白教程。

2024-07-24 16:32:40 637

原创 图文识别0难度上手~基于飞浆对pdf简易ocr并转txt

本篇pdf适用windows对视觉识别0基础的的纯小白用户。大佬请绕道~~注意:本项目pdf的ocr对于表格、画图文字,水印等干扰没做任何处理,因此希望各位使用该功能的pdf尽量不要含有这些干扰项,以免影响翻译效果。

2024-07-02 20:51:29 853

原创 零一万物的Yi-1.5-9B-Chat与智谱清言Chatglm4-9和Chatglm3-6B使用体验与比对(2024-07-02更新)

李开复「零一万物」公司的Yi-1.5可以说是Yi的升级版本。Yi-1.5 包括一系列预训练和微调模型,分为 6B、9B、34B 三个版本。它使用 500B tokens的高质量语料库训练,还有 3M 个多样化的微调样本进行微调。效果不错~排名又涨了一波。虽然我们经常听说有大厂把大模型小型化了,甚至装上手机。但是很遗憾,就目前而言,在没有全新的架构下,模型的智力水平和理解能力既和训练样本有关,也和模型尺寸成正比。GLM3确实有是很优秀,但终究是6B。

2024-05-21 20:46:41 1855

原创 FastGPT构建自己RAG智能客服和1个有意思的扩展玩法。模型的选择和提示词书写(本篇无代码)

知识爆炸的时代,学不完,根本学不完。

2024-05-21 15:20:36 1866

原创 OpenAI春季发布会-免费多模态GPT4O-简介

提供电脑版本可以被实时打断对话,让其补充或者修改(面对BBC记者必备技能),更像人类间的对话。对话语气更拟人。甚至甚至能读懂我们的语气。已经让大部分人无法方便其是否为机器人!是图片的理解能力,如下(黄字是GPT的话语)可以实现实时同声翻译()

2024-05-14 19:01:10 342 1

原创 yolov5-pytorch-Ultralytics教程,涵盖 训练+预测+报错处理

本篇使用的yolo5模型大小为yolov5l由于需要识别一图片些细小的物体,我在Ultralytics的yolov5添加了一些注意力机制,但本次不会展开说,因为添加注意力前后对我们训练和预测的操作流程都没有任何影响。训练+预测至此结束咯~~

2024-05-03 16:36:19 2884 4

原创 Meta的 Llama-3 在线使用与下载

Llama 3 在 24K GPU 集群上训练,使用了 15T 的数据,提供了 8B 和 70B 的预训练和指令微调版本,可以支持广泛的应用。目前得到的信息并不是很多,只知道Meta称Llama-3相比之前模型多使用了掩码和分组查询注意力这两项技术。(不明觉厉~)

2024-04-19 13:44:02 7136

原创 YOLO-World: Real-Time Open-Vocabulary Object Detection 简介+安装+运行

主干特征网络使用CNN会比Transform架构轻量化许多。YOLO中yolohead的分类器和方框定位中,对分类器进行非常有意思的修改,参考多模态大模型的实现的图文对齐,使其分类器那块不再是每个框的概率,而是变成每个框的特征向量。即每个检测框都有自己的特征向量,通过比对最接近文本类里距离最近的文本特征向量来判断该检测框的类别。待更新。

2024-04-13 16:56:23 2123 4

原创 windows下python3安装rolabelimg或者labelimg2标注斜框

安装下载rolabelimg和labelimg2

2024-04-08 16:25:01 1343

原创 吃瓜Grok大模型

今年当地时间2月29日晚,马斯克闹出来一件大事——正式起诉OpenAI和Sam Altman,并要求OpenAI 恢复开源GPT-4等模型。国际流量大师我只付服马斯克和川宝!!当大家觉得这扯皮的故事就此结束后,马斯克“不负众望”的整了一个大活:在3月18日,他开源GROK大模型!!3140 亿参数的Grok,这么大的模型,直接开源免费用!!!我滴个乖乖。然后国内沸腾,额,Grok概念股票沸腾了,仿佛这是我们开的源。不愧是缅A~国内大厂们嘛,也可以开心一下了,毕竟大家都有好东西可以学习了解一下嘛~

2024-03-22 16:26:23 437

原创 langchain+chatglm3+BGE+Faiss Linux环境安装依赖

本篇默认读者已经看过之前windows版本,代码就不赘述,本次讲述是linux环境配置。

2024-03-16 16:03:33 890

原创 (非代码层面)优化自己的本地langchain-chatglm3的QA效果思路分享。

本篇不讲代码,仅分享一些优化自己处理QA任务的向量库大模型的方法。

2024-03-16 14:01:50 1340 1

原创 超短代码实现!!基于langchain+chatglm3+BGE+Faiss创建拥有自己知识库的大语言模型(准智能体)本人python版本3.11.0(windows环境篇)

众所周知,大语言模型在落地应用时会遇到各种各样的问题。而其中模型的“致幻性”是非常可怕。目前主流之一的玩法就是通过知识库对回答范围进行限制。本来想等langchain-ChatChat大佬们的0.3.0版本。等待是折磨的,那不如在等待的时候,自己来瞎折腾玩玩。为了快速跑通,目前大家比较喜欢的就是用langchain来把Embedding模型和向量数据库和LLM模型串联起来。

2024-03-08 13:39:25 2079 3

原创 本小白ChatGLM3-6B 模型安装bug记录

时间:2023年11月18日14:46:00本文章用于记录本小白安装glm3b遇到的一些坑爹问题,我用的环境是操作环境为windows。

2023-11-18 14:47:13 789

原创 Flask-SocketIO安装与一些小bug笔记

原因gevent包冲突。

2023-06-07 14:08:09 727

原创 dlib gpu版本Windows编译

dlib GPU版本在Windows编译

2022-04-23 11:43:07 730

原创 Labelme的windows的可执行文件

Labelme的windows的可执行文件已经编译过的labelme不用再用pyinstaller去编译了~~好耶~~~~百度云:链接:https://pan.baidu.com/s/1egqy_4bGOOQIZT3B-kJopA提取码:glf1

2021-06-28 16:26:37 559

原创 在CDH上执行比较复杂的spark或sparkstreaming时,hdfs的空间明显变小,到最后甚至导致hdfs空间不足,无法执行spark任务!!

代码没有写入的hdfs的语句,但是hdfs空间莫名变小前言上面这个问题,足足困扰了我两天的时间,期间我改过代码,清空过hdfs回收站,设置hdfs日志大小,甚至还以为是本身空间小,扩充了挂载点的容量,但都无法解决。而这问题日益严重最终导致我hdfs空间被占用达到97%!然后spark直接宕机。分析实际上原因确实是来自日志,由于我sparkstreaming的比较繁琐,生成日志非常的大,...

2019-09-04 17:49:44 446

原创 spark实时监控sqlserver文件方法(追踪~增删改查)

前言本方法仅为个人一时脑洞成果,因此可能会存在不少瑕疵(虽然我还没遇到)请读者如果遇到bug时见谅(不装谦虚了,这样说话好累).经检验是在数据变化量不是很高时可以正常运行.至于该方法可以承受数据量阈值并未测试,欢迎各位读者自行测试,如果测出结果的话,欢迎您在留言处发布!!本文主要分下面两大块:1.思路模块2.实现模块思路Spark对SQLserve监控一旦不单只有增量监控(...

2019-07-23 00:29:57 955

原创 azkaban3安装教程(全程小白式操作)

废话区为了实现定时调用代码方法而又不想使用while循环然后sleep定时长的这么low的方法。显然azkaban是个不错的选择步骤0.安装要求1.你的jdk版本至少在1.8(含)以上2.你电脑已经安装MySQL,azkaban目前只认MySQL。没MySQL请自己度娘学装~~为了方便我们用root用户来装su然后输入密码按回车成功变成root用户1.下载...

2019-06-01 15:21:53 6918 3

原创 SQL Server(MMS)开启代理服务器(agent)方法(本篇版本展示界面为SQLserver2014)

第一步:在SQL Server Management Studio中连接到SQL Server实例后,会显示“SQL Server 代理”节点。如果当前该实例的Agent服务没有启动,“SQL Server 代理”后边就会显示“(已禁用代理XP)”。sp_configure 'show advanced options', 1;GORECONFIGURE WITH OVERRIDE;...

2019-05-06 09:51:04 7828

原创 关于sqlserver设置只有读权限用户无法读取文件报error229解决方法

首先跟着网上教程在设置用户时服务器角色设置为dbcreator,运行后发现可以看见数据库内表却无法读取表内容,并且报错229,只需在数据库右键属性在权限栏目下选择指定用户或用户组把选择权限勾上并确定即可!...

2019-04-19 09:47:50 1832

原创 Spark ml 或 mlib 常用便利函数方法与常忽略的问题

****************spark**************一、样本数据转换处理虽然是多余的话语,但是还是得提醒各位,mllib和ml的Vector类是不一样的!(一)格式转换对于原始数据中的字符变量,我们可以通过自定义装换方法或者导入HashTF()装换,后者方法具体操作如下:import org.apache.spark.ml.feature.HashingTF...

2019-04-01 11:02:57 355

原创 在Scala中使用StreamingContext.getActiveOrCreate遇到的坑

本次问题仅用于scala生产环境当我们在现实生产活动中尤其是在处理实时数据都难免会遇到某些特殊原因导致宕机,而当我们重新接收并处理的数据需要进行计算结果联系时,这种情况将会十分严重,因为宕机后之前在缓存数据都将在重启后消失.这就会导致计算结果产生误差.因此这里我们使用StreamingContext.getActiveOrCreate和ssc.checkpoint函数来处理,大体过程如下:v...

2019-01-21 09:47:50 1294

原创 Hbase更换版本遇到的一些问题与解决方法

在更新版本后我们发现hbase无法正常开启为什么呢?原因可能三个1.忘记把旧版中conf文件夹替换到新版本中2.Zookeeper中的hbase注册的信息是旧版的,无法识别新版本.解决方法: (在zookeeper启动节点中)在zookeeper文件夹下bin目录下使用 ./zkCl.sh命令进入zookeeper中然后使用 rmr /hbase 命令删除旧hbase注册信息3.在hdf...

2019-01-21 00:13:41 1517

原创 Windows黑窗口l连(HDFS)无响应,IDEA连Hbas也是长时间无响应,但可以在网页端正常访问HDFS

 使用该方法时,请确认您已经尝试在网上搜索到的其他方法均无效后,再使用本方法导致该问题原因有很多,我的原因是,win10系统的环境变量与注册列表缺少相关配置,因为我的Windows10是家庭版的!解决方法升级到win10专业版后,重置电脑!!!注意是重装系统后重置系统,这是两个步骤,如果你已经是win10专业版则直接重置系统即可!!!因为win10家庭版升级成专业版后会保留原有系统配置!!...

2019-01-15 09:15:39 260

原创 在IDEA中spark(enableHiveSupport)中使用 insert overwrite时对空表可以正常写入但是如果表不为空就会报错处理方法

spark特殊问题在IDEA中spark(enableHiveSupport)中使用 insert overwrite时对空表可以正常写入但是如果表不为空就会报错处理方法在网上看到不少回答都是答非所问,或者说更改Project Structre下Modules项目中的Language level 为6 - @Override in interfaces也没用现象分析与解决方法1.idea无...

2019-01-15 00:17:18 1651

windows安装可以读取中文路径中文标签的labelimg的启动器 你必须按文章配好设置才可以使用

这只是启动器!!你必须已经把这些环境配置好啊!!请搭配文章食用

2024-07-24

yolov5的Arial.Unicode.ttf

ultralytics的yolov5代码自动下载的Arial.Unicode.ttf文件

2024-04-30

用于langchain分词工具的nltk资源包

用于langchain分词工具的nltk资源包

2024-03-11

azkaban-3.73.1.tar.gz

azkaban的压缩包azkaban-3.73.1.tar.gz。(σ゚∀゚)σ..:*☆哎哟不错哦

2019-06-01

UnlimitedJCEPolicyJDK8.rar

jdk的无限强度管辖政策,仅限1.8版本哦|ू・ω・` )(σ゚∀゚)σ..:*☆哎哟不错哦

2019-06-01

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除