- 博客(1700)
- 资源 (125)
- 收藏
- 关注
原创 免费论文aigc降重方法,AIGC降重提示词,优秀降重
在下面这个提示词里,加上三千字你那个领域的一些正常人说话的材料,可以去书籍里找找或者自己以前写过的文字材料,以前没AI的时候是怎么说话的就加这里。然后把这个提示词给腾讯元宝里的DeppSeekR1,你就可以得到降重后的文章。只有DeppSeekR1有这么优秀的理解模仿能力,或者找o1。网上的提示词都很低能,我这里介绍一个我使用的思路。降重网站写的材料都太弱智了。然后把提示词最后加上你想要改写的文字,不能太多,建议一小节一小节给入。思路很简单,让AI模仿你的真实说话风格,比如你的用词和句式。
2025-03-18 10:51:31
288
原创 LLaMA-Factory多机多卡训练实战
参考资料:https://llamafactory.readthedocs.io/zh-cn/latest/advanced/distributed.html以训练qwen2.5vl 7b 为例子。more。
2025-03-17 21:30:41
294
原创 LLaMA-Factory微调sft Qwen2.5-VL-7B-Instruct
"content": "你是一个擅长识别印章上文字的助手,输出json字符串给用户。",},"content": "<image>识别图片里红色印章上的公司名称或单位名称(印章主文字)。",},"content": "{\"印章主文字\": \"饮酒太原近似收益有限公司\"}",],"seal": {},"tags": {
2025-03-17 11:23:49
616
原创 MSP430 Proteus 仿真作品
单片机的 P1.4~P1.7 接 4 个开关 s0~s3,P1.0~P1.3 接 4 个发光二极管 LED0~LED3。个相应的发光二极管的状态,例如 P1.4 引脚上开关 S0 的状态,由 P1.0 脚上的 LED0 显示;本题目中 ADC0809 的参考电压为+5V,根据定义,当接在单片机 P1.0、P1.1、P1.5 和 P1.6 脚开关都闭合时,SWl 开关接 5V 时,右转弯灯闪亮,74LS245 是缓冲驱动器,作为扩展的输人口,它的 8 个输入端分别接 8 个开关 K7~K0。
2025-03-16 20:07:30
794
原创 x012-MSP430F249智能步进电动百叶窗_proteus_光敏电阻_步进电机_仿真
系统通过步进电机驱动叶片旋转,集成光敏传感器检测环境光强,具备手动/自动双模式切换、角度限位保护、实时数据显示等功能。设计一个光检测器,用 LED/LCD 显示光强度值(这个要外接光线感应器,或者用按键模。• LCD双行显示:首行显示当前角度(ANG),次行自动模式下显示光强值(LUX)设置按键: 手动/自动切换、手动正转和手动反转,停止/启动键。• 5个功能按键:模式切换/正转/反转/启停/参数设置。当正转到极限位置时,电机停止正转,但还可以反转;当反转到极限位置时,电机停止反转,但还可以正转。
2025-03-16 20:04:42
440
原创 解析GNGGA数据,C语言单片机
这段GPS数据表明设备在UTC时间13:03:33.000时,位于北纬41.723942度、东经123.482748度,海拔93.1米的位置,使用了14颗卫星进行定位,水平定位精度优秀(HDOP=1.2),定位质量为标准GPS定位(Fix Quality=1)。• 表示大地水准面高度(Geoid Height),即实际地球表面与参考椭球面之间的高度差,单位为米。• 表示GPS数据记录的时间,以UTC(协调世界时)格式显示,具体为13时03分33秒000毫秒。• 此处为1,表示标准GPS定位。
2025-03-13 20:15:43
119
原创 ControlNet Reference模型:reference_adain、reference_adain+attn与reference_only的区别与应用场景解析
预处理器核心机制特点适用场景AdaIN(风格迁移)注重整体风格迁移,颜色和风格变化明显需要风格迁移,如将照片转换为二次元风格AdaIN + 注意力机制精细控制细节,风格和细节高度匹配需要高度细节匹配,如线稿转换为完整图像直接参考图像保留参考图风格,生成内容略有变化快速生成与参考图风格一致的图像。
2025-03-13 10:54:18
371
原创 使用 crontab 定时同步服务器文件到本地
是一个可以自动输入密码的工具。• 确保任务路径正确,使用绝对路径。文件,确认任务是否执行成功。替换为您的 SSH 密码。替换为您的 SSH 密码。等待 15:00 后,检查。假设您需要将远程服务器的。• 查看日志文件(如。
2025-03-11 14:39:15
508
原创 使用mergekit合并大型语言模型
SLERP(球面线性插值)SLERP是一种在两个向量之间平滑插值的方法,适用于高维空间中的向量插值。它能够保持向量的几何特性,避免线性插值带来的向量长度缩减问题。slices:- sources:t:TIES(任务特定模型合并)TIES-Merging通过消除冗余参数和解决参数符号冲突,将多个任务特定模型合并为一个多任务模型。models:DARE(随机权重重置与重缩放)DARE通过随机重置微调权重并重缩放权重,将多个模型合并为一个。models:Passthrough(层拼接)
2025-03-06 10:35:32
553
原创 Copilot替代品代码补全插件——免费的CodeGPT——如何调用自己的大模型API
痛点与解决方案作为开发者,你是否因Copilot的高昂费用而犹豫?别担心,今天为大家推荐一款完全免费的替代方案——CodeGPT!它不仅支持代码智能补全,更可自定义接入私有化大模型API,实现个性化开发体验。本文手把手教你如何配置CodeGPT插件,打造专属AI编程助手。more。
2025-03-05 16:35:47
628
原创 EMQX MQTT Broker Docker部署
集群概览集群概览是指 EMQX 集群的总体状态和健康状况。通过集群概览,您可以查看集群中各个节点的运行状态、负载情况、连接数等信息。这对于监控和管理整个集群的运行情况非常重要。客户端客户端是指连接到 EMQX 服务器的 MQTT 客户端设备。每个客户端都有一个唯一的客户端标识符(Client ID),并且可以发布消息、订阅主题以及接收消息。EMQX 服务器会管理这些客户端的连接状态、会话信息等。订阅管理订阅管理是指对客户端订阅的主题进行管理。客户端可以订阅一个或多个主题,以接收发布到这些主题的消息。
2025-03-04 16:57:19
918
原创 VLM-R1 实战训练教程
指定使用 bfloat16 数据类型进行训练,以更好地利用 GPU 的计算能力。这里设置为 false。: 指定梯度积累的步数,即在执行反向传播之前累积的梯度步数。: 指定 master 节点的地址,用于分布式训练的通信。: 指定生成模型输入的最大 prompt 长度。: 指定仅保存模型权重,不保存优化器状态等信息。: 指定当前节点的排名,这里是0号节点。: 指定每个设备上的训练批次大小为 1。: 指定 master 节点的端口号。: 指定每个节点上的进程数为 8。: 指定每个输入生成的输出序列数。
2025-03-03 16:02:29
881
2
原创 大夏龙雀科技4G Cat1 CT511-AT0 MQTT联网实战教程
通过本教程,您已经成功配置并连接了大夏龙雀科技4G Cat1 CT511-AT0模块到MQTT服务器,并进行了消息的订阅和发布。希望本教程对您的开发工作有所帮助。
2025-03-01 11:19:57
1274
原创 阶跃星辰 Step-Vedio-T2V Docker 推理
moreStep-Video-T2V是一款由StepFun团队发布的最先进(SoTA)的文本生成视频预训练模型。该模型拥有300(即30B)亿参数,并能生成长达204帧的视频。其核心技术包括深度压缩的视频变分自编码器(Video-VAE)、3D完全注意力机制的DiT架构、中英双语预训练的文本编码器、人类偏好优化(DPO)技术。该模型在专门设计的视频生成基准测试Step-Video-T2V-Eval上表现卓越,全面超越其他开源和商业引擎。
2025-02-24 17:27:06
885
原创 DeepSeek 系列论文解读
*2024 年 1 月发布。提出新的缩放分配策略。结合**DeepSeekMoE**(更细粒度的专家,共享/路由结构)和**多头潜在注意力(MLA)**,通过减少KV缓存实现高效推理。- **数学/代码:** MATH-500(90.2% EM),LiveCodeBench(40.5% Pass@1),Codeforces(51.6%ile)。- **多步学习率调度分布**:训练初期2000步内达到最大值,然后80%的训练token之后减少到31.6%,接着到达90%的token时减少到10%。
2025-02-19 16:15:24
538
原创 【LLM】由LayerNorm向RMSNorm
归一化层作为深度神经网络的核心组件,直接影响模型的训练动力学与泛化能力。本文从数学推导与计算图视角系统解析LayerNorm与RMSNorm的算法差异,结合Transformer架构演进规律,揭示大语言模型时代归一化技术的工程选择策略。通过理论分析与实验数据交叉验证,阐明RMSNorm在百亿参数级模型中的性能优势及其物理意义。more。
2025-02-13 17:03:00
67
原创 自抗扰控制(ADRC)代码,带宽法,控制倒立摆
自抗扰控制(Active Disturbance Rejection Control)由韩京清教授提出,其核心思想是将系统内外部的扰动统一视为"总扰动",通过扩张状态观测器实时估计并补偿。:生成过渡过程并提取微分信号:实时估计系统状态和总扰动:综合误差生成控制量。
2025-02-13 15:12:43
137
原创 OpenWebUI使用DeepSeek R1满血版,DeepSeek R1 API调用
可以自己修改一个模型名称便于认识,然后这个函数就可以显示出思考过程了。
2025-02-12 18:08:59
1908
1
原创 Android Java Ubuntu系统如何编译出 libopencv_java4.so
【代码】Android Java Ubuntu系统如何编译出 libopencv_java4.so。
2024-12-20 13:48:50
297
原创 sglang 部署Qwen2VL7B,大模型部署,速度测试,深度学习
图来源:https://lmsys.org/blog/2024-09-04-sglang-v0-3/纯transformer,不用加速框架,我之前的测了一张图的速度是:5.22 seconds,很慢。
2024-11-18 15:05:13
2376
原创 背景移除,主体物抠图模型 RMBG-2.0:最佳一键去背景模型
准确性:高精度地分离前景和背景。效率:优化以实现快速推理时间。多功能性:在各种图像类别(包括通用股票图片、电子商务、游戏和广告内容)中表现良好。内容安全:确保生成的内容安全且适当。合法授权的数据集:训练数据完全合法,避免法律问题。偏见缓解:训练数据中平衡了性别、种族和残疾人的代表性。
2024-11-14 10:04:23
726
原创 ollama Docker部署 Qwen2.5-Coder-32B-Instruct
【代码】ollama Docker部署 Qwen2.5-Coder-32B-Instruct。
2024-11-13 13:43:00
531
原创 Qwen2.5-Coder-32B-Instruct Docker 部署openai接口
openwebui这个镜像里面是装了ollama的,直接进容器打开。这是量化后的模型,🈷约20G大小。吃62G显存,还需要max-model-len降到这么低,太大了。(img-yryWF50B-1731466165927)](img-gh4hPApW-1731466165928)](img-jHBWQPYw-1731466165928)]下载过程中如果网络突然慢了,那就断开,重新下,这个指令本身支持断点续传。Ollama默认绑定127.0.0.1端口11434。
2024-11-13 10:49:32
1254
原创 Ubuntu卸载并安装新的Nvidia驱动
如果一切正常,应该可以看到NVIDIA驱动的版本信息和显卡状态。驱动(这是NVIDIA开源驱动,可能会冲突)。重启系统,并再次进入命令行模式(进入命令行模式,然后登录。按照安装程序提示完成安装。已下载到本地目录(例如。
2024-11-11 15:14:24
3064
原创 如何控制vLLM的显存,显存爆炸,显存溢出,qwen2.5显存
vLLM是一个用于加速大语言模型推理的开源库,主要通过智能批处理和显存优化技术,使大模型在多GPU环境中高效运行。vLLM采用了动态KV缓存机制,这使得它在多请求场景中能够显著提升吞吐量和响应速度。
2024-11-07 14:14:11
2512
原创 Qwen2.5 vs Llama3.1 对比
Qwen2.5通过其多种版本和增强功能,展现了在通用语言处理、编程、数学推理等多个领域的强大能力。无论是在技术提升还是在应用生态的广泛支持上,Qwen2.5都为开发者和研究人员提供了强有力的工具,预示着AI领域的新一轮创新浪潮。
2024-11-05 16:51:20
1356
原创 Meta更新了MobileLLM
模型地址:https://huggingface.co/collections/facebook/mobilellm-6722be18cb86c20ebe113e95。适用于移动设备的小型LLM,大小分别为125M、350M、600M、1B。Meta更新了MobileLLM。
2024-11-05 14:03:49
104
原创 hertz-dev:斯坦福开源的音频模型
官方介绍:https://si.inc/hertz-dev/hertz-dev:斯坦福开源的音频模型。音频端到端基础模型,延迟120ms。
2024-11-05 14:03:14
130
原创 Docker lmdeploy 快速部署Qwen2.5模型openai接口
官方教程文档:https://github.com/InternLM/lmdeploy/blob/main/docs/zh_cn/llm/api_server.md。我已经把模型下载到/data/xiedong/Qwen2.5-72B-Instruct-GPTQ-Int4。浏览器访问接口文档:http://101.136.8.66:23333。该API类似于OpenAI的Completion API。该API类似于OpenAI的Completion API。获取详细API规范。获取详细API规范。
2024-11-05 10:54:02
715
原创 Docker镜像加速办法,docker pull不求人
max-model-len:这个参数表示模型的上下文长度,即模型可以处理的最大输入长度。如果用户输入的长度超过这个限制,模型通常会报告错误,表明输入过长。为了符合该限制,通常需要对输入进行截断。max_num_seqs:这个参数指定了在同一时间内可以并行处理的请求数量,也就是批处理中的序列数量。如果这个值设置得过高,可能会消耗更多的内存,因此降低它可以帮助节省内存。相差很大,Vllm快得多。平均时间: 16.79 秒。平均时间: 3.31 秒。平均时间: 1.63 秒。
2024-11-05 10:32:29
1578
51单片机 示波器 LCD12864 淘宝资料 论文 淘宝爆款
2020-01-19
STM32F103VET6 正点原子 移植 模板 ,模仿正点原子工程
2019-12-17
LCD12864 万年历 单片机 农历 显示 温度DS18B20 DS1302 AT24C02
2019-12-05
STM32F103RCT6 PCB 原理图 打板 原子 mini
2019-11-29
TI tiva tm4C ARM 库函数手册
2019-11-26
android P 9.0 支持HTTP
2019-09-25
PIC16F887 官方文档 用户手册 另加2个仿真例程 LCD1602 矩阵键盘 拨号 计算器 音乐盒
2019-09-19
kaggle 猫狗数据集二分类 系列(1)构建模型进行二分类,保存模型,画出走势图 代码
2019-09-16
avr MEGA16 DS1302 LCD1602 万年历 时钟显示 proeus 仿真 + 程序
2019-09-11
Gitxmind GIt bash 使用 xmind
2021-07-11
SHT3x_Datasheet_digital英文手册.pdf
2021-02-21
51单片机 普中V2 数字时钟 电子时钟 万年历 DS1302 LCD1602 AT24C02
2020-10-26
STM32F103C8T6 单片机 ESP8266 12F接入机智云
2020-09-05
工具软件 MSP430F149下载程序所需要用到的软件
2020-07-05
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人