- 博客(81)
- 收藏
- 关注
原创 8G 显存玩转书生大模型 Demo 基础任务
基础任务使用 Cli Demo 完成 InternLM2-Chat-1.8B 模型的部署,并生成 300 字小故事,记录复现过程并截图。
2024-08-05 10:43:43
124
原创 扩散模型ddpm原理
总结:模型反向还原过程中,除模型推理得到噪声预测,还需要从标准正太分布中采样一份噪声,两者的线性组合得到前一时刻的降噪结果,这里可能会有较大的不确定性(对于生成式任务来说,是ok的,但对于非常精细的任务,如降噪,不希望降噪前后图像的特征有明显位移,这里是一个不可控的点,但从标准正太中采样的noise在训练时必须使用(李宏毅课程中有做验证,不加效果极差))扩散模型ddpm原理。
2024-06-12 17:05:52
212
原创 c++ visualstudio2017 opencv debug源码 windows配置
在build文件夹下会产生OpenCV.sln,将vs2017以管理员身份运行,打开该解决方案,设置其为debug x64,重新生成解决方案,然后install如下。注意其中的包含目录、库目录(包含目录是头文件,用哪里的都无所谓,但库目录是buid下的lib的Debug,这个文件夹下包含gdb文件,是能够debug到源码的关键)链接器的输入中的附加依赖项为build\lib\Debug文件夹下的所有.lib文件名。注意其中的最后两行,是在build下的bin的Debug和Release。
2024-05-15 16:05:28
436
原创 visual studio安装onnxruntime包
其中文件夹结构如下图所示,.nupkg包为下载下来的onnruntime包,下载地址为。命令中如果不设置-Source及后面路径,则会默认从网上下载安装。如果本地已下载好,可以运行这个命令。
2024-03-13 14:01:29
983
原创 灰度图和灰度图转bgr彩图结果的差别
同样的,对灰度图进行cvtColor(gray2bgr)的效果和以彩图进行读取的效果也是一样的。对其用cv2以0进行读取和默认的彩图读取,其效果没差。只不过以0读取的数据复制了三个通道而已。对这样一种特殊的图像(本身是灰色的)
2024-02-22 17:58:09
242
原创 ubuntu系统下c++ cmakelist vscode debug(带传参的debug)的详细示例
vscode的c++ cmake插件 带参数debug
2024-02-05 17:13:10
1299
原创 XTuner 微调 课程学习
大语言模型于海量的文本内容上,以无监督和半监督的方式进行训练的模型微调的目的:使其在具体的使用场景或领域中输出更好的回答增量预训练——给模型喂新的领域知识;指令跟随或指令微调——基于海量的预训练数据训练出来的模型通常叫做——base模型或预训练模型,在没有进行指令微调的模型上进行测试,模型只是单纯的对给定的输入进行在训练数据集上的拟合,而不能意识到在对模型进行提问,为了让模型在测试过程中有更好的表现,需要对基座模型进行指令微调。
2024-01-15 19:15:20
617
原创 大模型第三节课程笔记
基于langchain搭建RAG应用:首先对于本地的文档形式存在的个人知识库,会使用UnstructedLoader组件加载本地文档,该组件将不同格式的本地文档,统一成纯文本格式;对于每一个用户输入,首先将基于向量模型sentence transformer,将输入文本转化为向量,并在向量数据库中匹配相似的文本段,在这里我们认为与问题相似的文本段,大概率包含了问题的答案,然后会将用户的输入和检索到的相似文本段一起嵌入到模型的prompt中,传递给interlm,然后得到输出。
2024-01-08 19:26:59
554
原创 第二节课内容学习
运行后,会一直处于等待状态,该命令的作用为监听远程33090的6006端口,并映射到本地1727.0.0.1网址上。监听远程端口,并映射到本地。
2024-01-08 14:27:59
436
原创 模型蒸馏学习
通过这样做,我们的方法着重于模拟网络间通道的软分布。总结:在语义分割中的cwd算法,可以看作是基于响应的KD,也可以看作是基于特征的KD,因为在传统的cwd算法中,使用的是在通过softmax之前的位置作为蒸馏位点,输出对应的特征图,去计算损失。mmseg的模型,在deconde_head.conv_seg后拿到的特征图为logist的特征图,其内的元素都为小数,而非预测的0/1。cwd算法是一种什么样的蒸馏算法呢是data-free的吗,还是online的呢,还是offline的呢。
2023-11-07 11:15:09
615
1
原创 django和celery的项目,nginx和uwsgi协议,在通过api端口进行deeplearning任务的训练和排队
ngix在启动时,如果不配置nginx的配置文件,则只会有nginx的欢迎页,其配置文件在/etc/nginx/nginx.conf中,需要以sudo的方式vim更改,在更改时,需要向http中添加server的{},同时,listen和server_name是最重要的;而在ai_service中有wsgi.py,其中会用到settings.py这个config用以配置环境。Django项目和celery结合的项目中的config文件(独立于nginx,能独立运行)nginx和uwsgi中的配置文件。
2023-09-21 19:20:33
488
3
原创 docker命令学习
docker run --gpus all --shm-size=8g -it imageID (运行镜像,-it为与容器进行交互)docker rmi imageID 删除镜像(要将所有使用该镜像的容器都删除后才能操作)docker rm -f continerID 删除容器。docker images (查看所有的镜像)docker ps -a (查看所有的容器)docker ps (查看运行的容器)
2023-08-31 13:55:13
320
原创 ast在python架构中的使用
(mmlab中的config机制,采用了另一种方式,并不对config文件的语法进行解析,而是基于base congfig 对个人的config进行merge和替换,得到最终的config,然后通过底层维护的字符串到类的映射拿到config中字符串字段中type的字符串,从而拿到类及其参数)下面的代码展示了以demo.py中的ast语法,对source_code.py中的内容进行修改,并将修改后的内容转回源代码并写入到target_code.py中,这个过程可以作为客户化定制的内容。
2023-08-23 12:34:41
388
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人