AI大模型学习_浪淘沙jkp的博客-优快云博客

AI大模型学习

关注

文章平均质量分 87

学习大模型相关知识，看到哪里学到哪里，作为学习笔记与大家共同进步

关注数：文章数：31 文章阅读量：38993 文章收藏量：495

作者: 浪淘沙jkp

这个作者很懒，什么都没留下…

展开

专栏收录文章

windows 下，通过python 将wma格式的音频转化为mp3格式

摘要：本文介绍如何通过FFmpeg将WMA音频批量转换为MP3格式。首先下载FFmpeg并配置环境变量，安装Python及pydub、ffmpeg-python库。编写Wma2MP3.py脚本，该脚本自动读取wma文件夹中的音频文件，使用FFmpeg进行格式转换（192kbps比特率、44.1kHz采样率），输出到mp3文件夹。运行步骤包括：放置WMA文件到指定目录，在命令行执行python脚本完成转换。整个流程实现了WMA到MP3的自动化批量转换。

原创 2025-06-10 08:39:16 · 538 阅读 · 0 评论
AI大模型学习三十三、HeyGem.ai 服务端(ubuntu)docker 安装 /客户端(win)分离部署

本文记录了在Ubuntu 25.04系统上部署HeyGem服务端和客户端的完整流程。主要包括：1）安装NVIDIA 570驱动；2）配置Docker环境并安装NVIDIA工具包；3）通过Samba设置共享目录；4）部署HeyGem服务端容器；5）修改客户端配置文件并编译Windows安装包。重点解决了显卡驱动、网络共享和跨平台兼容性问题，最终生成HeyGem-1.0.4-setup.exe安装程序。整个过程涉及系统配置、容器部署和应用程序打包等技术环节。

原创 2025-06-06 22:42:14 · 1496 阅读 · 0 评论
AI大模型学习三十一、Docker创建、部署和维护必备工具指南

摘要： Docker作为容器化应用管理工具，在规模扩展时面临管理复杂性问题。本文介绍了三款高效管理工具：1）LazyDocker提供命令行可视化界面，简化容器/镜像管理；2）Dive用于镜像分层分析，优化存储空间；3）Portainer提供Web图形界面，支持多主机管理。这些工具覆盖从命令行到GUI的不同使用场景，帮助开发者提升Docker管理效率，适用于各技能水平的用户。安装步骤简洁明了，通过终端命令或浏览器即可快速启动使用。

原创 2025-05-30 16:40:40 · 1169 阅读 · 0 评论
AI大模型学习三十、ubuntu安装comfyui,安装插件，修改返回405 bug，值得一看喔

ComfyUI是基于节点的开源Web应用，用于通过文本提示生成图像，支持扩散模型及相关工具（ControlNet、Lora等）。开发环境搭建包括：创建云环境、下载源码、安装插件管理器、配置虚拟环境（Python 3.10、torch等依赖）并运行服务。配置需设置模型文件路径（如权重、VAE文件），可通过修改extra_model_paths.yaml调整基础路径指向Stable Diffusion项目目录。服务启动后支持本地访问及图像预览功能。

原创 2025-05-27 22:47:54 · 843 阅读 · 0 评论
AI大模型学习二十九、地表最强开源数字人硅基heygem+ubuntu 本地非docker部署，由文本直接生成数字人，独一份，值得一看喔

本文介绍了在腾讯CloudStudio环境下源码安装HeyGem-Linux-Python-Hack开源数字人模型的过程。HeyGem是由硅基智能推出的Windows开源AI数字人模型，具有秒级克隆、高效推理、4K视频输出等功能。由于CloudStudio不支持Docker，作者采用源码安装方式，详细记录了从环境准备（Python3.8、CUDA11.7）、依赖安装到模型下载的全流程，包括解决库文件缺失、人脸检测失败等问题。最终成功运行数字人项目，可用于内容创作、在线教育等场景。

原创 2025-05-26 23:32:32 · 2121 阅读 · 0 评论
AI大模型学习二十八、ACE-Step：生成式AI音乐大模型简介与安装（一）

摘要：ACE-Step是一款突破性的开源音乐生成模型，融合扩散生成、深度压缩自动编码器(DCAE)和线性Transformer架构，解决了现有技术在生成速度、连贯性和可控性之间的矛盾。该模型在A100 GPU上仅需20秒即可生成4分钟音乐，比基于LLM的基线快15倍，同时保持卓越的音乐质量和歌词对齐能力。支持多语言创作、音色克隆、分轨生成等高级功能，提供编辑和重生成选项增强可控性。ACE-Step采用一阶段DiT架构和REPA训练机制，显著提升音乐结构性和生成效率，是音乐创作民主化的重要里程碑。

原创 2025-05-25 19:25:06 · 1480 阅读 · 0 评论
AI大模型学习二十七、xinference一次部署CHATTTS + whisper-tiny + qwen3:8b多个大模型（参考意义巨大），改写dify 数字人应用

本文详细介绍了如何在腾讯CloudStudio平台上使用Xinference部署多个AI模型，包括qwen3、whisper-tiny和ChatTTS，并实现多模型同时运行。首先，通过安装Xinference和相关依赖，配置虚拟环境，并分别启动不同端口以运行多个模型。接着，通过Dify平台配置这些模型，并结合awesome-digital-human-live2d技术，打造数字人应用。文章还提供了安装和启动脚本，简化了部署流程。最终，用户可以通过Dify平台实现语音对话功能，并集成数字人形象，完成一个完整的

原创 2025-05-23 17:52:50 · 1922 阅读 · 1 评论
AI大模型学习二十五、利用Dify 1.4.0 chatflow工作流生成专业级提示词，为打造dify应用保驾护航

Dify是一个面向开发者的AI应用开发平台，旨在帮助用户快速构建基于大语言模型（如GPT、Claude等）的应用程序。在Dify中，"提示词"（Prompt）是驱动AI模型生成内容的核心工具，通过优化提示词可以显著提升生成结果的准确性和实用性。提示词在Dify中的核心作用包括任务定义、输出控制、上下文管理、知识库集成和用户交互优化。在Dify中创建chatflow工作流的步骤包括创建应用、配置开始节点、条件分支、添加LLM节点和直接回复节点。LLM节点分为通用优化专家节点、输出信息要求

原创 2025-05-18 09:31:58 · 2287 阅读 · 0 评论
AI大模型学习二十四、实践QEMU-KVM 虚拟化：ubuntu server 25.04 下云镜像创建Ubuntu 虚拟机

在某些情况下，Docker可能无法满足大型软件的安装需求，尤其是当多个软件需要使用相同的端口时，可能会导致冲突。为了解决这一问题，可以将这些软件安装在独立的虚拟机中，以实现完全隔离。本文详细介绍了在Ubuntu Server 25.04命令行中使用KVM/QEMU虚拟化工具安装Ubuntu虚拟机的步骤。首先，确认系统支持虚拟化并安装KVM/QEMU及相关工具。接着，下载云镜像并设置目录权限。然后，将用户加入libvirt组并检测KVM情况。通过编辑元数据信息和生成cloud-init ISO，配置网络为桥接

原创 2025-05-15 21:09:48 · 1637 阅读 · 0 评论
AI大模型学习二十三、在ubuntu 25.04 物理机docker-compose 安装code server 实现云IDE平台指南,并安装dify v1.3.1

随着云计算的普及，云IDE（集成开发环境）平台的使用逐渐增多，它们通过网页浏览器提供统一的开发环境，支持实时协作，减少不兼容性并提升生产力。本教程详细介绍了如何在Ubuntu服务器上搭建基于code-server的云IDE平台，code-server是运行在远程服务器上的Microsoft Visual Studio Code，可通过浏览器访问。教程内容包括安装Docker和Docker Compose、配置Nginx作为反向代理、生成自签名SSL证书以确保安全，以及如何通过域名访问该平台。此外，还介绍了如

原创 2025-05-14 16:23:04 · 1007 阅读 · 0 评论
AI大模型学习二十一、Dify升级指南

Dify社区发布了v1.3.1版本，带来了多项更新以优化大语言模型运维（LLMOps）的操作和工作流程。新功能包括VTT转文档转换、高级存储管理以及Vastbase向量数据库支持。此外，前端时区支持、内嵌聊天机器人用户体验增强和允许上传文件夹知识库等改进也提升了用户体验。同时，修复了模型插件顺序、授权及密码自动填充、导入模板错误等问题。升级步骤包括备份自定义的docker-compose YAML文件、拉取最新主分支代码、停止服务、备份数据并启动服务。升级后建议清理浏览器缓存。

原创 2025-05-13 10:11:03 · 409 阅读 · 0 评论
AI大模型学习二十、利用Dify+deepseekR1 使用知识库搭建初中英语学习智能客服机器人

本文介绍了如何利用LLM（大型语言模型）和知识库来增强智能代理（Agent）的问答能力，特别是在客服和检索工具等特定领域的应用。传统的基于关键词检索的客服机器人在处理非关键词问题时表现不佳，而知识库通过语义级别的检索解决了这一问题，减轻了人工负担。文章详细解释了Embedding技术，即将离散型变量转化为连续向量表示的过程，以及其在自然语言处理中的应用。此外，文章还介绍了如何在Dify平台上创建和管理知识库，包括文本分段、索引方式、Embedding模型的选择和检索设置。最后，文章指导了如何创建应用，包括问

原创 2025-05-12 22:19:18 · 1557 阅读 · 0 评论
AI大模型学习十九、利用Dify+deepseekR1 使用文件上传搭建文章理解助手

在Dify平台中，用户可以通过文件上传功能直接将本地文件作为上下文提供给LLM（大型语言模型）进行理解，从而避免手动复制粘贴大量信息的不便。这一功能特别适用于处理如学术报告、法律合同等承载大量信息的文档文件。通过创建名为“文章理解助手”的Chatflow应用，用户可以配置多个节点，包括开始节点、迭代节点、文档提取器节点和LLM节点，以实现对文档内容的深入分析和问题提出。例如，LLM节点可以从文档中提取文章结构并总结关键内容，同时提出有深度的问题以引导读者深入思考。这一流程不仅提高了文档分析的效率，还为用户提

原创 2025-05-12 17:15:24 · 1112 阅读 · 0 评论
AI大模型学习十八、利用Dify+deepseekR1 +本地部署Stable Diffusion搭建 AI 图片生成应用

本文介绍了如何利用Dify和StableDiffusion实现文生图工作流。Dify作为低代码AI开发平台，通过可视化编排和API快速集成，与StableDiffusion的高效文生图能力结合，降低了AI绘画开发门槛，加速创意落地。文章详细说明了安装Stable-Diffusion-WebUI的步骤，并提供了相关代码修改和资源下载地址。接着，文章描述了创建SD工具、应用，以及通过大模型将自然语言转换成SD提示词的过程，并展示了如何测试和生成图片。最后，文章强调了整个工作流的测试和输出变量的添加。

原创 2025-05-11 23:06:06 · 2239 阅读 · 3 评论
AI大模型学习十七、利用Dify搭建 AI 图片生成应用

本文介绍了如何利用Dify平台快速开发一个基于Stable Diffusion的AI图片生成应用。首先，用户需要注册并获取Stability API密钥。接着，在Dify中创建工具并授权Stability API。然后，选择本地部署的LLM模型，并添加AI绘图工具Stability。在撰写提示词时，需注意使用英文并包含详细描述，如“一个穿着中国国家队足球服、正在现代化球场上踢球的男孩”。最后，通过发布应用，用户可以获得一个在线运行的AI图片生成网页。整个过程展示了从注册到发布应用的完整流程，帮助用户快速上手

原创 2025-05-10 20:01:54 · 1349 阅读 · 0 评论
AI大模型学习十六、全球最牛逼开源模型--通义千问模型Qwen3发布，通过Ollama+Dify+Qwen3构建生成式 AI 应用-创建agent应用

2025年4月29日凌晨，阿里巴巴开源新一代通义千问模型Qwen3，其中旗舰模型 Qwen3-235B-A22B 在代码、数学、通用能力等基准测试中，与 DeepSeek-R1、o1、o3-mini、Grok-3 和 Gemini-2.5-Pro 等顶级模型相比，表现出极具竞争力的结果。

原创 2025-04-30 20:34:32 · 1169 阅读 · 0 评论
AI大模型学习十五、白嫖腾讯Cloud Studio AI环境通过Ollama+Dify+DeepSeek+searxng构建生成式 AI 应用-创建Agent应用

我想创建一个在出门旅行的指南agent应用，需要阅读前面的文章AI大模型学习十三、白嫖腾讯Cloud Studio AI环境通过Ollama+Dify+DeepSeek构建生成式 AI 应用-安装-优快云博客AI大模型学习十四、白嫖腾讯Cloud Studio AI环境通过Ollama+Dify+DeepSeek构建生成式 AI 应用-接入DeepSeek大模型-优快云博客。

原创 2025-04-28 19:23:09 · 985 阅读 · 0 评论
AI大模型学习十四、白嫖腾讯Cloud Studio AI环境通过Ollama+Dify+DeepSeek构建生成式 AI 应用-接入DeepSeek大模型

我们今天干点啥呢，跟着官网走模型类型。在创建的应用中，用的是该类型的模型。智聊、对话名称生成、下一步问题建议用的也是推理模型。。在知识库中，将分段过的文档做 Embedding 用的是该类型的模型。在使用了知识库的应用中，将用户的提问做 Embedding 处理也是用的该类型的模型。已支持的 Embedding 模型供应商：OpenAI、ZHIPU(ChatGLM)、Jina AI(。已支持的 Rerank 模型供应商：Cohere、Jina AI(。将对话型应用中，将语音转文字用的是该类型的模型。

原创 2025-04-28 14:40:04 · 557 阅读 · 0 评论
AI大模型学习十三、白嫖腾讯Cloud Studio AI环境通过Ollama+Dify+DeepSeek构建生成式 AI 应用-安装

Dify 是一款开源的，旨在通过低代码/无代码的交互方式，降低开发者构建生成式 AI 应用的门槛。Dify 提供直观的可视化界面，支持通过拖拽和配置快速定义应用逻辑（如提示词设计、上下文管理、工作流编排），无需深入编写复杂代码，适合非技术人员参与开发。支持集成主流 LLM（如 OpenAI、Claude、Llama3 等）及开源模型，并允许自定义模型接入。开发者可根据需求灵活切换模型，结合 RAG（检索增强生成）技术提升生成内容的准确性。

原创 2025-04-28 13:49:38 · 1115 阅读 · 0 评论
AI大模型学习十二：‌尝鲜ubuntu 25.04 桌面版私有化sealos cloud + devbox+minio对象存储测试和漫长修改之路

前面已经安装完成，这里我们测试对象存储AI大模型学习十一：‌尝鲜ubuntu 25.04 桌面版私有化sealos cloud + devbox+minio，实战运行成功-优快云博客。

原创 2025-04-25 15:37:15 · 907 阅读 · 0 评论
AI大模型学习十一：‌尝鲜ubuntu 25.04 桌面版私有化sealos cloud + devbox+minio，实战运行成功

用了ubuntu 25.04，内核为GNU/Linux 6.14.0-15-generic x86_64，升级了部分image，过程曲折啊sealos 能干啥对集群生命周期进行管理，一键安装高可用 Kubernetes 集群，增删节点清理集群自恢复等通过 sealos hub 下载和使用完全兼容 OCI 标准的各种分布式软件如 openebs,minio,ingress,pgsql,mysql,redis 等。

原创 2025-04-23 19:17:33 · 1200 阅读 · 1 评论
AI大模型学习十：‌Ubuntu 22.04.5 调整根目录大小，解决根目录磁盘不够问题

由于默认安装时导致home和根目录大小一样，导致根目录不够，所以我们调整下。

原创 2025-04-15 17:05:39 · 464 阅读 · 0 评论
AI大模型学习四：‌DeepSeek Janus-Pro 多模态理解和生成模型本地部署指南（折腾版）

‌‌是一款先进的多模态理解和生成模型，旨在实现高质量的文本-图像生成与多模态理解。它是由研发的，是之前的升级版，能够同时处理文本和图像，即可以理解图片内容，也能生成图像‌。

原创 2025-04-04 23:54:25 · 1236 阅读 · 0 评论
AI大模型学习六：‌小米8闲置，通过Termux安装ubuntu做个随身服务器

纯粹看着那个破手机放在那里碍眼，折腾折腾，后盖都没了，电话别人听不到声音。

原创 2025-04-08 11:53:51 · 672 阅读 · 0 评论
AI大模型学习九：‌Sealos cloud+k8s云操作系统私有化一键安装脚本部署完美教程

‌‌是一款基于（K8s）的云操作系统发行版，它将K8s以及常见的分布式应用如Docker、Dashboard、Ingress等进行了集成和封装，使得用户可以在不深入了解复杂的K8s底层原理的情况下，快速搭建起一个功能完备的云原生应用运行平台‌。Sealos具有简单易用、快速部署、高度可定制化等优点，适用于开发测试环境的快速搭建以及生产环境的稳定部署‌。

原创 2025-04-12 07:37:13 · 929 阅读 · 0 评论
大模型学习八：‌Sealos 私有化部署之VMware 安装ubuntu22.04 虚拟机安装(实操)

Sealos 私有化部署之VMware 17 安装ubuntu22.04 虚拟机安装

原创 2025-04-11 22:19:53 · 1303 阅读 · 0 评论
AI大模型学习七：‌小米8闲置，直接安装ubuntu，并安装VNC远程连接手机，使劲造

对于咱们技术人来说，就没有闲的蛋疼的时候，那不是现在机会来了。

原创 2025-04-08 19:57:25 · 1424 阅读 · 0 评论
AI大模型学习五：‌DeepSeek Janus-Pro-7B 多模态半精度本地部署指南：环境是腾讯cloudstudio高性能GPU 16G免费算力

由于前面玩过了，所以啥也别说，就是显存不够玩，要优化，没钱就是这么回事，看下图，显存实际只有15360M，确实是16G+如何获取算力。

原创 2025-04-06 17:38:56 · 1652 阅读 · 0 评论
AI大模型学习三：DeepSeek R1蒸馏模型组ollama调用流程

目前DeepSeek R1及其蒸馏模型均支持使用ollama进行调用，可以在模型主页查看调用情况显存需求，我们显存是16G，可以玩好几个。

原创 2025-04-03 22:37:46 · 803 阅读 · 0 评论
AI大模型学习二：DeepSeek R1+蒸馏模型组本地部署与调用

DeepSeek R1+蒸馏模型组通过“大模型生成-小模型学习”路径，实现了高性能与低成本的平衡。其在科学计算、教育等领域的应用已验证其潜力，而开源生态与工具链支持进一步降低了开发者使用门槛。未来，随着蒸馏技术的持续优化，轻量级模型的实际效能有望进一步逼近原版。

原创 2025-04-03 22:12:47 · 1834 阅读 · 0 评论
AI大模型学习一：deepseek api 调用实战以及参数介绍

DeepSeek（杭州深度求索人工智能基础技术研究有限公司）是一家专注于大语言模型（LLM）研发的中国创新型科技公司，成立于2023年7月17日，由孵化。其核心产品包括开源推理模型、多模态模型等，以高性能、低成本和开源免费为特色，广泛应用于医疗、编程、应急管理等领域。‌‌‌‌‌‌‌。

原创 2025-04-02 14:13:45 · 1610 阅读 · 0 评论

AI大模型学习

作者: 浪淘沙jkp

windows 下，通过python 将wma格式的音频转化为mp3格式

AI大模型学习三十三、HeyGem.ai 服务端(ubuntu)docker 安装 /客户端(win)分离部署

AI大模型学习三十一、Docker创建、部署和维护必备工具指南

AI大模型学习三十、ubuntu安装comfyui,安装插件，修改返回405 bug，值得一看喔

AI大模型学习二十九、地表最强开源数字人硅基heygem+ubuntu 本地非docker部署，由文本直接生成数字人，独一份，值得一看喔

AI大模型学习二十八、ACE-Step：生成式AI音乐大模型简介与安装（一）

AI大模型学习二十七、xinference一次部署CHATTTS + whisper-tiny + qwen3:8b多个大模型（参考意义巨大），改写dify 数字人应用

AI大模型学习二十五、利用Dify 1.4.0 chatflow工作流 生成专业级提示词，为打造dify应用保驾护航

AI大模型学习二十四、实践QEMU-KVM 虚拟化：ubuntu server 25.04 下云镜像创建Ubuntu 虚拟机

AI大模型学习二十三、在ubuntu 25.04 物理机docker-compose 安装code server 实现云IDE平台指南,并安装dify v1.3.1

AI大模型学习二十一、Dify升级指南

AI大模型学习二十、利用Dify+deepseekR1 使用知识库搭建初中英语学习智能客服机器人

AI大模型学习十九、利用Dify+deepseekR1 使用文件上传搭建文章理解助手

AI大模型学习十八、利用Dify+deepseekR1 +本地部署Stable Diffusion搭建 AI 图片生成应用

AI大模型学习十七、利用Dify搭建 AI 图片生成应用

AI大模型学习十六、全球最牛逼开源模型--通义千问模型Qwen3发布，通过Ollama+Dify+Qwen3构建生成式 AI 应用-创建agent应用

AI大模型学习十五、白嫖腾讯Cloud Studio AI环境 通过Ollama+Dify+DeepSeek+searxng构建生成式 AI 应用-创建Agent应用

AI大模型学习十四、白嫖腾讯Cloud Studio AI环境 通过Ollama+Dify+DeepSeek构建生成式 AI 应用-接入DeepSeek大模型

AI大模型学习十三、白嫖腾讯Cloud Studio AI环境 通过Ollama+Dify+DeepSeek构建生成式 AI 应用-安装

AI大模型学习十二：‌尝鲜ubuntu 25.04 桌面版私有化sealos cloud + devbox+minio对象存储测试和漫长修改之路

AI大模型学习十一：‌尝鲜ubuntu 25.04 桌面版私有化sealos cloud + devbox+minio，实战运行成功

AI大模型学习十：‌Ubuntu 22.04.5 调整根目录大小，解决根目录磁盘不够问题

AI大模型学习四：‌DeepSeek Janus-Pro 多模态理解和生成模型 本地部署指南（折腾版）

AI大模型学习六：‌小米8闲置，通过Termux安装ubuntu做个随身服务器

AI大模型学习九：‌Sealos cloud+k8s云操作系统私有化一键安装脚本部署完美教程

大模型学习八：‌Sealos 私有化部署之VMware 安装ubuntu22.04 虚拟机安装(实操)

AI大模型学习七：‌小米8闲置，直接安装ubuntu，并安装VNC远程连接手机，使劲造

AI大模型学习五：‌DeepSeek Janus-Pro-7B 多模态半精度本地部署指南：环境是腾讯cloudstudio高性能GPU 16G免费算力

AI大模型学习三：DeepSeek R1蒸馏模型组ollama调用流程

AI大模型学习二：DeepSeek R1+蒸馏模型组本地部署与调用

AI大模型学习一：deepseek api 调用实战以及参数介绍

AI大模型学习二十五、利用Dify 1.4.0 chatflow工作流生成专业级提示词，为打造dify应用保驾护航

AI大模型学习十五、白嫖腾讯Cloud Studio AI环境通过Ollama+Dify+DeepSeek+searxng构建生成式 AI 应用-创建Agent应用

AI大模型学习十四、白嫖腾讯Cloud Studio AI环境通过Ollama+Dify+DeepSeek构建生成式 AI 应用-接入DeepSeek大模型

AI大模型学习十三、白嫖腾讯Cloud Studio AI环境通过Ollama+Dify+DeepSeek构建生成式 AI 应用-安装

AI大模型学习四：‌DeepSeek Janus-Pro 多模态理解和生成模型本地部署指南（折腾版）