procoder338-优快云博客

原创大模型微调技术: 从基于Stable Diffusion的绘画谈起

文生图和图生图应用已经出现一段时间了,目前常用的应用就是根据用户需求修改图片,事实上这就是一种自定义. 因为需要模型重新生成整张图或者部分图,要么通过prompt、reference image,也就是改变输入的方式;要么通过修改模型,也就是微调模型的方式. 因此诞生出了许多微调模型的方式,目前常用的微调库是. 针对AI绘图应用的微调技术,倒是可以推出一道清晰的发展线. 这里简单整理一下.

2025-01-04 10:41:08 1298

原创通过服务器推送消息:Websocket和SSE解释

最近在看LLM的流式输出如何反映到json输出上,现有的解决方案包括 WebSocket 或 Server-Sent Events (SSE) 实时通信技术.

2025-01-01 14:46:46 1345

原创文生图相关模型最新进展小结

不得不说,civitai已经成为这方面的github和huggingface了.

2024-11-13 10:48:30 2260

原创窗口系统与图形绘制接口

当我们想要进行底层图形应用(GUI)开发时,往往需要用到窗口系统和图形库,这里简单介绍一下。

2024-10-07 22:09:14 1014

在linux使用cmake开发c/c++程序链接动态库时使用rpath添加搜索目录,使用windows开发开发动态库实在麻烦,一般默认隐式链接然后使用导出(因为默认不导出),如果使用现成的xx.dll和libxx.lib就不需要声明宏了,因为链接了DLL导入库(也就是libxx.lib)至于生成的DLL放哪,连微软自己都说放在可执行文件同一目录中,在vs中可将“后期生成事件”添加到项目中,以此添加一条命令,将 DLL 复制到生成输出目录.我的配置如下。

2024-10-04 17:33:40 1276

原创现代cpp多线程与并发初探

用于创建一个执行的线程实例,所以它是一切并发编程的基础,使用时需要包含<thread>头文件, 它提供了很多基本的线程操作,例如get_id()来获取所创建线程的线程 ID,使用join()来等待这个线程结束（与该线程汇合）等等std::mutex是 C++11 中最基本的互斥量类,可以通过构造std::mutex对象创建互斥量, 而通过其成员函数lock()可以进行上锁,unlock()可以进行解锁. 但是在实际编写代码的过程中,最好不去直接调用成员函数, 因为调用成员函数就需要在每个临界区的出口处调用。

2024-09-28 19:40:09 970

原创 c++与cmake:完整的C++项目构建注意事项

总结使用cmake构建c++项目经验,从创建项目到打包发布总结一下需要注意的事情.

2024-09-18 23:28:03 1652

原创 xmake与包管理:又一个现代c++构建工具?

因为我已经在很多项目中使用了cmake,经验相对更多,xmake学习起来并不困难,搭配官方文档很容易搭建一个项目.但目前还是推荐使用cmake+vcpkg/cpm.cmake方案,因为更成熟,解决方案更多.

2024-09-12 21:08:25 2072

原创 CUDA101:学习cuda编程

CUDA上图展示了16个并行(流)多(streaming multiprocessor)处理块(digrams)每个并行多处理块有8个并行处理器(streanming processors),所以一共128个并行处理器每个并行处理器有一个乘加单元 (Multiplication and Addition Unit)和一个加单元(multiplication unit).一张GT200显卡有30个并行多处理器,每个处理器有8个并行处理器,所以一共240个并行处理器,有多余1的TFLOP处理能力。

2024-09-08 19:22:41 1668 1

原创从零开始写一个简单的httpserver

使用c++基于socket库编写了一个简单的httpserver,主要作用是从请求头中解析字段并返回响应数据,并使用zlib库支持gzip压缩,这里顺便推荐一下平台,有许多练习,同时可以使用接近二十种语言.

2024-07-28 17:18:51 411 2

原创 dive deeper into tensor:从底层开始学习tensor

and这属于karpathy的课程.事实上他还有很多值得一看的课程和repos.tensor分成哪些部分?一个tensor可以分为元数据区和存储区（Storage）信息区主要保存着tensor的形状（size）、步长（stride）、数据类型（type）,storage_offset,layout等信息,而真正的。

2024-07-11 20:46:57 783

原创不同编程语言之间的互操作:Py,Js,Java调用C/C++

Node-API 是用于构建native addons的 API。它独立于底层 JavaScript 运行时（如 V8），并作为 Node.js 自身的一部分进行维护。该 API 在不同版本的 Node.js 中具有稳定的应用二进制接口 (ABI)。其目的是使附加组件不受底层 JavaScript 引擎变化的影响，并允许为某一版本编译的模块无需重新编译即可在以后版本的 Node.js 上运行。addons使用node-gyp 等构建/打包。if (status!if (status!

2024-07-01 16:52:50 914

原创 2024年跨平台应用解决方法

很久没有写这类high-level的文章了,本身这类框架就一直层出不穷,但是其中历久弥坚,坚韧不拔的框架又有多少呢?首先考虑到学习成本以及掌握一些编程语言在工作、学习生态上的价值,给这些东西适用生态划分一下.

2024-06-08 16:57:13 1665 1

原创 [国产大模型简单使用介绍] 开源与免费API

随着大模型技术蓬勃发展和开源社区越来越活跃,国内的大模型也如雨后春笋一般.这时,一些就会问了,有了llama3,Mistral还有Gemma等等,国外大厂接连发力,一些开源社区也会有一些不错的模型,国内怎么比?对一个人使用,ollama或者gpt4all直接本地使用,对于一个组,使用1panel+ollama+maxKB部署在内网也成了最佳搭配. 国内大模型怎么比?

2024-05-22 12:21:05 1849

原创从论文中看AI绘画

主要看是看Diffusion Models,CLIP,ControlNet,IP-Adapter这种经典论文,尝试总结论文写作的一些方式以及图像生成模型的一些内在思想. 对于其中的数学原理和代码不过深究.

2024-05-05 16:27:50 1059

原创本地使用LLM的方法总结

就目前而言, Ollama或者GPT4All是绝对够用的,上面三个工具选择一个即可. 如果想要在服务器上提供API也是不错的.

2024-04-26 20:39:25 1270 4

原创 Node web框架小赏

之前写了Python,现在写点NodeJS的,当然目前JS的运行时还有Deno和Bun,不过还是需要时间检验.而Node的后端框架也不少,其中佼佼者当属Nest.js,而更小的有Express这种.这里就写写Express,Koa,Fastify以及Nest这几个框架的介绍以及示例代码,以供后续技术选型使用.首先完全可以不使用框架写一些api${${

2024-04-05 22:17:34 1138 3

原创 python的Web框架比较

之前好像写过一些关于Python的Web框架?现在再按照ASGI与原本的WSGI区分一下,顺便把(framework)与(library)区分一下.之前我也写过(或者说想过)一些类似生态以及作用的框架进行比较,大多都是看看网上评价以及star数,现在我想大概使用以下感受一下氛围,毕竟现在找工作一般也不会强调用python的web(事实上python的web确实要比Java的生态啥的要差).

2024-03-31 15:36:23 1572

原创 C# xaml框架以及Java的ORM介绍

c#有ASP.Net,.NET以及EF Core这几个重要的运行时和框架.分别用于web,应用以及数据库的ORM.目前跨平台的有Avalonia UI,.Net MAUI以及Uno Platform,至于WPF等本身不是跨平台的,但可以依靠其他库实现跨平台.这里面Avalonia应该是认为bug比较少的.当然目前最火的跨平台解决方案应该是Flutter,其次是React Native.至于EF Core,看看代码就知道有多么简洁优雅了.using var db = new BloggingCont

2024-03-21 22:46:10 617

原创 TypeScript on the way:学习TypeScript

早该学学了.之前写过Python的类型系统,如果对于写C++,Java,C#等这类语言来说,typing根本不成问题,所以理解TypeScript也不是问题.

2024-02-19 16:50:52 967

原创注意力与transformer:位置编码与vision transfomer

介绍注意力机制与transfomer模型,特别关注相对位置编码以及一种vision transformer的而变形

2024-02-19 15:46:04 1027

原创【深度学习下载大型数据集】快速下载谷歌云盘数据集

跑深度学习的时候,一些数据集比较大,比如60多个G,而且只是训练集.然后这些数据是由某些实验室组采集的,并不像一些大公司搞的,一般都直接方法一些网盘中.如果是谷歌网盘,本身通过代理也不麻烦,但是发现即使通过代理,下载的速度也非常慢,如果频繁下载还会被限制.这里给一个方法,通过租赁廉价服务器下载谷歌云盘的数据集,然后自己再通过公网下载.速度要快一些.我通过IDM下载谷歌云盘上的大型数据集时速度低的时候可能才五六百KB,使用这种方法20多G的数据40s左右下载到服务器上。

2024-01-02 18:01:20 2408 1

原创 [Github-bot]帮助处理issue和PR的github-bot

在看一些开源项目时,会发现一些帮忙处理issue和PR的bot,这些bot都是基于Github的Apps。

2023-12-26 15:50:59 991

原创 [Python工程化之路] 搭建Python开发环境包管理环境以及Linter

在工程化上,Python相比于Java,C#这类语言还是差了不少,不过整个生态还是不错的.

2023-12-26 15:49:25 1350

原创 [Latex写作] vscode搭建latex写作环境

如果是为了方便简洁,实际使用完全够了,之前也写过使用Obsidian写文章的教程. 这次主要介绍使用在本地vscode加上插件写论文.

2023-12-25 10:25:52 3654

原创 matplotlib与opencv图像读取与显示的问题

最近在用opencv和matplotlib展示图片,但是遇到了一些问题,这里展开说说首先需要明确的是,opencv和matplotlib读取图片都是通道在最后,而前者默认可见光图像是BGR,后者是RGB.此外还有PIL以及imageio等读取图像的工具,这里不一一赘述.

2023-11-30 12:33:22 449

原创 Type Hints in Python:python的类型注释

Python中的类型系统,使用type hints使得整个开发过程更加顺畅.类似typescript的目的.

2023-11-29 19:47:58 213

原创深度学习中的图像融合:图像融合论文阅读与实战

介绍图像融合概念，回顾sota模型，其中包括数字摄像图像融合，多模态图像融合，接着评估一些代表方法介绍一些常见应用，比如RGBT目标跟踪，医学图像检查，遥感监测。

2023-11-19 14:06:07 5639

原创 NLP学习:深入NLP

之前学过一段时间NLP,因为其中涉及到一些深度学习常用的知识或者框架,但苦于不系统以及没有任务focus不能长久.这里借助微软的教程写点东西.

2023-11-19 14:01:00 622

原创【大模型微调实战】使用Peft技术与自己的数据集微调大模型

LLM是大型语言模型的缩写，是人工智能和机器学习领域的最新创新。2022年12月，随着ChatGPT的发布，这种强大的新型人工智能在网上疯传。对于那些足够开明的人来说，生活在人工智能的嗡嗡声和科技新闻周期之外，ChatGPT是一个在名为GPT-3的LLM上运行的聊天界面。最近的大模型就是Meta的llama2当然还有openai的GPT4,google的PaLM2.国内有清华的ChatGLM等等.

2023-11-01 10:15:08 7912 1

原创想要炼自己的模型?GPU服务器不完全测评

由于本人没有合适的GPU服务器训练模型(没钱买服务器),只能在网上租了.

2023-10-25 13:38:59 548

原创 [计算机视觉] 目标检测学习

得到2000个区域proposals后,CNN充当特征提取器，并且输出密集层由从图像中提取的特征组成，并且提取的特征被馈送到SVM中以对该候选区域提议内的对象的存在进行分类。虽然对于图像分类，很容易测量算法的性能，但对于对象检测，我们需要测量类的正确性以及推断的边界框位置的精度。对于两个相同的区域，IoU将是1，而对于完全不相交的区域，它将是0。在预测时，我们为每个图像生成多个锚框，预测所有锚框的类别和偏移量，根据预测的偏移量调整它们的位置以获得预测的边界框，最后只输出符合特定条件的预测边界框。

2023-10-23 17:48:10 339

原创 CMake学习

在Windows上开发c++相比Linux还是有点不方便,这里介绍CMake,跨平台的构建工具.在Windows上可选择的构建后端有vs,codeblocks这种软件的文件结构,或者单纯的Makefiles以及Ninja.相当于忽略了几个项目构建的差异.

2023-10-14 15:05:09 73

原创 [深度学习教程] 训练的tricks

最近在看微软的AI for Beginners,质量比较高,这里相当于将其中的一篇文章写过来加点自己的理解.模型的训练的一个主要问题是梯度爆炸或者梯度消失,前者会导致训练不稳定,表现出来就是损失值不稳定,一直都处在较高值降不下去,后者就是更新缓慢.下面介绍一些技巧。

2023-10-04 12:12:28 116

原创 [计算机视觉DL学习] 迁移学习风格迁移基础学习

将一个图像中的风格应用在另一图像之上，即风格迁移（style transfer）这里我们需要两张输入图像：一张是内容图像，另一张是风格图像。我们将使用神经网络修改内容图像，使其在风格上接近风格图像。more。

2023-10-01 18:13:00 464

原创 [GAN学习] 生成动漫人物头像

生成式AI以及比较新的概念AIGC最近比较火,之前的Diffusion model也很火,但是一般的电脑不太好训练,这里使用了GAN模型生成动漫人物他头像,简单易懂。

2023-09-20 17:19:50 503

原创 [机器学习]KL散度——两个概率分布的相似度量

现有的度量方式有很多，但我们主要关心的是尽量减少必须发送的信息量。这两个模型都将我们的问题简化为两个参数，牙齿数和概率（尽管我们实际上只需要均匀分布的齿数）。信息的最佳编码是一个非常有趣的话题，但对于理解KL分歧来说并不是必要的。将KL散度视为距离度量可能很诱人，但我们不能使用KL散度来测量两个分布之间的距离。这是因为KL散度不是对称的。熵的关键在于，只要知道我们需要的比特数的理论下限，我们就可以准确地量化数据中的信息量。本质上，我们所看到的KL散度是原始分布中数据的概率与近似分布之间的对数差的期望。

2023-09-10 12:34:28 975

原创【机器学习】F1-score那些事

如果你有一个不平衡的数据集，那么你应该使用macroF1分数，因为即使类是偏斜的，这仍然会反映真实的模型性能。然而，如果你有一个平衡的数据集，那么可以考虑microF1分数，特别是如果与最终用户交流结果很重要的话。

2023-09-02 12:35:13 1366

原创 [AI写作工具评测]评价市面上的AI写作产品

众所周知,目前AI可以粗浅的分为cv,nlp以及语音相关.这几个方面都可以生成,目前相关的工具也特别多,这时候就要确定自己的目的,如果是为了便于写作,做上层的东西,那就首先要求自己的内容和主题,然后才是确定工具.本人打算写几篇关于现在的一些AIGC方面工具的评测,包括文字,图像以及语音.随着深度学习神经网络的发展,AI的概念也越来越火,AIGC等概念也越来越深入人心,相比于之前炒的很热的web3,元宇宙啥的,这个至少效果是很不错的,但是背后的一些原理什么的还是很令人捉摸不透,不过这就是学术界的事情了.

2023-09-01 20:43:19 378 1

原创 [全面教程]Javascript DOM操作(一)

对于一个节点来说，它的父节点只可能是三种类型：元素节点（element）、文档节点（document）和文档片段节点（documentfragment)js的DOM操作大致可以分为几个section介绍,从DOM的基础概念,选择元素,遍历元素,控制元素,控制属性,处理事件等等.由于父节点只可能是三种类型：元素节点、文档节点（document）和文档片段节点（documentfragment）。只有文本节点（text）、注释节点（comment）和属性节点（attr）有文本值，因此这三类节点的。

2023-09-01 20:40:48 170

运动想象脑电信号学习资料+代码

运动想象脑电信号是时间序列信号：例如在某通道连续记录的脑电信号，可以在时间域中表示为信号幅度或其他值相对于时间的变化，也可在频率域中表示为信号功率沿频率变化的分布. 本资源包括脑电EEG的预处理,特征提取以及后续分类的资料以及代码,适合想要入门学习脑电信号的人群,用于使用Matlab预处理脑电数据与特征提取,并使用Python进行分类处理.脑电图（Electroencephalogram,EEG）是通过精密的电子仪器，从头皮上将脑部的自发性生物电位加以放大记录而获得的图形，是通过电极记录下来的脑细胞群的自发性、节律性电活动。有常规脑电图、动态脑电图监测、视频脑电图监测.这里指的是头皮脑电.脑电信号分为自发性和诱发性两种，自发性EEG是在没有特定外界刺激的情况下大脑皮层的神经元自发性的进行电活动；诱发性EEG指由感官刺激引起的大脑皮层某一区域的电位的节律性变化。

2023-07-30

TA关注的人

运动想象 脑电信号 学习资料+代码

西工大 编译原理课程 实验班作业+课程资料 2022

python深度学习图像伪造对抗攻击

吴恩达机器学习 matlab代码 课件

机器学习 西工大作业 课件

西工大软件工程课件作业

西工大计算社会学课程资料

西工大计算机网络理论作业

西工大计算机网络实验报告最新

计组实验_西工大.zip

https的ip下访问非433端口显示不安全

运动想象脑电信号学习资料+代码

西工大编译原理课程实验班作业+课程资料 2022

吴恩达机器学习 matlab代码课件

机器学习西工大作业课件