- 博客(674)
- 资源 (3)
- 收藏
- 关注
原创 基于 OpenVINO GenAI 运行Qwen3-14B模型推理
摘要:英特尔OpenVINOGenAI是专为生成式AI开发优化的工具库,支持在CPU、GPU等英特尔硬件上高效部署多模态应用。本文详细介绍Qwen3-14B-INT4-OV模型的安装、量化和推理流程,包括设备兼容性检查、推理性能指标(如TTFT首token时间)的测量方法,以及如何通过流式生成计算token吞吐量。实验显示该工具能有效简化大语言模型在英特尔平台上的部署,并提供详细的性能分析功能。(148字)
2025-11-12 10:41:56
268
原创 OpenWebUI本地开发指南
本文介绍了Open WebUI项目的开发环境搭建与部署流程。首先需准备操作系统和开发环境(Python 3.11+、Node.js 22.10+),然后克隆代码仓库。前端部分需配置环境变量、安装依赖并启动开发服务,后端建议使用Conda隔离Python环境后启动服务。文章还提供了跨设备联调方法,包括局域网访问配置和CORS白名单设置。最后给出了Linux和Windows系统下的Docker镜像编译脚本,包含端口映射、数据卷挂载等配置参数,支持项目容器化部署。
2025-11-12 10:27:57
299
原创 将火山云TOS存储桶挂载到Linux服务器
摘要:本文介绍了使用Goofys和S3FS工具挂载TOS存储桶的详细步骤及注意事项。主要内容包括:1)安装Goofys/S3FS工具;2)配置密钥文件并执行挂载命令;3)验证挂载结果;4)常见问题排查方法。特别强调S3FS性能限制、多客户端协调问题,以及生产环境推荐使用API而非挂载方式。文中提供了完整的命令示例和关键参数说明,并指出TOS仅支持VirtualStyle访问方式。
2025-10-28 18:10:32
736
原创 使用Optimum-habana对LLM模型训练推理
摘要:optimum-habana是连接Transformers/Diffusers库与Intel Gaudi AI加速器(HPU)的接口工具,支持单卡和多卡环境下的模型训练与推理。它提供已验证支持的多种主流模型架构(如BERT、GPT、Llama等)及任务类型(文本生成、问答等)。文档详细介绍了Docker环境搭建、依赖安装方法,以及单卡/多卡训练、LoRA微调和模型推理的具体配置参数,特别是针对大语言模型(如Llama-2 70B)的分布式训练优化方案。
2025-09-26 19:54:00
1131
原创 统计用户的N日留存
N日留存率是衡量用户留存的关键指标,计算公式为指定日期新增用户中在N天后仍活跃的用户占比。与"最近N日活跃"不同,N日留存聚焦特定同期群在精确时间点的留存表现。SQL示例通过三步骤实现7日留存计算:1)识别用户首访日期;2)记录用户活跃日期;3)关联数据计算留存率。该方法能准确评估新用户7天后的留存情况,反映产品粘性。(147字)
2025-09-23 10:50:54
240
原创 Llama-Factory微调 Qwen2.5-VL-3B 模型
本文详细介绍了Qwen2.5-VL-3B多模态模型的LoRA微调全流程。首先说明硬件需求(3B模型约需8-12GB显存)和环境搭建步骤,包括创建虚拟环境、安装依赖项和下载模型。重点阐述了多模态数据集准备规范(JSON格式+图像目录)和数据集注册方法。推荐使用LoRA轻量级微调以降低显存需求,提供了命令行和WebUI两种训练方式及详细参数配置。最后介绍模型测试、导出方法和常见问题解决方案,特别强调数据质量、显存优化和模型兼容性等关键注意事项。
2025-08-21 19:57:01
1225
原创 LTM框架Letta
Letta是一个开源框架,用于构建具有长期记忆和高级推理能力的有状态AI代理。框架支持多种模型和数据库,安装后可通过环境变量配置LLM和嵌入模型。提供本地服务器运行和Web开发环境(ADE),支持API接口管理代理,包括创建、查询和交互功能。兼容SQLite和PostgreSQL,支持Ollama等本地模型部署。开发者可通过REST API或Python客户端实现代理管理,适用于构建复杂的对话系统和智能应用。
2025-08-21 19:22:58
523
原创 基于SIFT/ORB计算图像的旋转角度和缩放比例
文章摘要:本文介绍了通过特征点匹配计算图像间旋转角度的方法。使用SIFT或ORB算法提取特征点,BFMatcher进行匹配,再用estimateAffinePartial2D函数计算仿射变换矩阵,从中提取旋转角度和缩放比例。提供了完整的SIFT和ORB实现代码,并指出特征匹配质量、旋转角度范围和算法性能等注意事项。该方法适用于图像处理中的旋转检测,可根据实际需求选择不同特征提取算法。
2025-08-20 09:56:55
433
原创 Windows下搭建Ubuntu系统并部署Python环境
摘要:本文介绍了WSL安装配置全过程。首先通过PowerShell启用WSL并安装Ubuntu分发版,随后配置挂载目录权限。接着安装Python3.12及必要开发工具,创建虚拟环境并配置pip清华源。然后安装CUDA工具包验证环境,修改pip缓存路径。最后详细说明如何迁移WSL的ext4.vhdx文件到新位置,包括导出、卸载和重新导入等步骤。整个流程涵盖从基础环境搭建到深度学习工具链配置,并提供了关键配置文件的修改方法。
2025-08-20 09:54:02
422
原创 Qwen2.5-VL-3B模型4bit推理
阿里巴巴推出新一代多模态模型Qwen2.5-VL,支持图像、文本和视频理解,具备更强的代理决策能力。该模型采用优化架构,支持结构化输出,在文档图表理解和视频分析任务中表现优异。提供3B到72B多种规模版本,其中3B模型经量化后可在8GB显存设备运行。文章详细介绍了模型特性、硬件要求、部署方法及输入格式限制,并提供了4-bit量化推理的代码示例和显存优化建议。
2025-08-06 00:37:15
1283
原创 使用BART模型和T5模型实现文本改写
摘要:BART和T5是两种主流的预训练语言模型,均采用编解码架构。BART结合BERT的双向编码和GPT的自回归解码,通过文本破坏还原任务预训练,适用于生成和理解任务。T5提出统一文本到文本框架,所有任务均转换为text-to-text形式,采用span掩码预训练。两者都支持多种下游任务,BART更侧重生成,T5强调任务统一性。中文场景下可通过微调实现文本改写等功能,典型实现使用HuggingFace的transformers库加载预训练权重进行推理。
2025-08-01 20:08:30
989
原创 Android使用MediaProjectionManager获取游戏画面和投屏
Android系统通过MediaProjectionManager实现屏幕录制和截屏功能,需先获取用户授权。主要步骤包括:获取管理器实例、创建权限请求Intent、处理授权结果并获取MediaProjection对象。关键是通过createVirtualDisplay()创建虚拟显示,需指定屏幕参数和渲染目标Surface。使用注意事项包括版本适配、权限管理、资源释放等,特别在Android14+需注意令牌的单次使用限制。该功能为开发者提供了灵活的屏幕内容捕获方案,可用于录制、截图等场景。
2025-08-01 20:01:05
700
原创 使用 Canvas 替代 <video> 标签加载并渲染视频
本文提出了一种基于WebGPU+Canvas2D的高性能视频渲染方案,解决传统video标签首帧延迟问题。核心思路是将视频解码与渲染分离:隐藏的video标签负责解码,WebGPU通过importExternalTexture获取视频帧纹理,配合Canvas2D实现高效渲染。方案采用requestVideoFrameCallback优先的帧同步机制,动态调整画布尺寸,并复用WebGPU对象(纹理、绑定组等)提升性能,最终构建出跨平台、低延迟的视频播放管线。关键实现包括视频帧回
2025-07-29 23:51:02
571
原创 YOLOv11.pt 模型转换为 TFLite 和 NCNN 模型
鉴于 Windows 的兼容性问题,强烈建议使用 Google Colab,因为它提供 Linux 环境,预装 CUDA,兼容 ai_edge_litert。只需上传模型和脚本,安装依赖即可完成转换。
2025-07-29 23:48:38
835
原创 Electron将视频文件单独打包成asar并调用
本文将介绍如何将视频文件打包到单独的asar包中并让Electron应用正常调用。首先调整项目结构,将视频文件单独存放;然后使用asar命令打包视频文件;接着修改forge.config.js配置,设置asar选项并忽略视频目录;在主进程中注册自定义协议处理asar文件资源;最后在渲染进程中通过注册的协议引用视频文件。关键步骤包括asar打包、协议注册和CSP策略设置,确保视频资源能通过app://协议正常访问。
2025-07-29 23:44:56
367
原创 图像特征检测算法ORB
ORB(Oriented FAST and Rotated BRIEF)是一种在计算机视觉领域广泛应用的特征检测与描述算法。
2025-06-19 18:00:49
715
原创 图像特征检测算法SIFT
SIFT(Scale - Invariant Feature Transform,尺度不变特征变换)是一种计算机视觉领域的特征提取算法,具有重要的地位和广泛的应用。
2025-06-19 17:52:40
1080
原创 图像特征检测算法SuperPoint和SuperGlue
SuperPoint 是一个自监督的全卷积神经网络,用于提取图像中的兴趣点及其描述子。它在 2018 年由 Magic Leap 提出,通过在合成数据集上预训练一个基础检测器 MagicPoint,然后利用同胚适应技术对真实图像数据集进行标记,从而得到一个增强的检测器 SuperPoint,使其在真实世界图像上具有可靠性。
2025-06-17 19:34:52
1155
原创 Python去除图像背景
rembg 是一个开源的 Python 库,专门用于去除图像背景,它利用深度神经网络能够准确地识别并去除图像背景,使用户无需进行复杂的手动编辑,只需几行代码即可获得专业效果。Rembg 基于 U2-Net 架构,有多种架构修改和经过测试的方法以提供最佳结果,还提供对 GPU 安装的访问以实现更快的处理。
2025-06-17 19:14:52
301
原创 图像特征检测算法
图像特征检测是计算机视觉的基础技术,用于提取图像中的关键信息。传统算法包括SIFT(高鲁棒性但计算慢)、SURF(SIFT的加速版本)、ORB(实时性强)、Harris角点检测(简单高效)和FAST(极速检测)。边缘检测算法如Canny可提取连续轮廓,HOG和LBP分别适用于形状和纹理特征。深度学习方法如CNN和SuperPoint通过端到端学习实现更高精度。算法选择需权衡速度、精度和应用场景,当前趋势是深度学习主导、轻量化部署和多模态融合。传统与深度学习方法正在融合,以构建更高效的视觉系统。
2025-06-17 19:12:20
1058
原创 使用 LSTM/GRU 预测设备异常的模型
LSTM 和 GRU 都被广泛应用于自然语言处理、时间序列预测、语音识别等领域。LSTM 由于其强大的长期依赖建模能力,在需要处理长序列数据时通常表现更好,但计算成本较高。而 GRU 在一些对实时性要求较高或计算资源有限的场景下,由于其结构简单、计算效率高,可能会成为更优的选择。
2025-05-16 16:40:56
1182
原创 使用 swift 微调 Qwen3-4b 模型
Qwen3 推荐使用 Axolotl、UnSloth、Swift、Llama-Factory 等训练框架来进行 SFT、DPO、GRPO 等微调模型的处理。魔搭社区提供的 ms-swift 框架,支持 500 多种大模型与 200 多种多模态大模型的训练、推理、评测、量化与部署,涵盖众多知名模型。它还汇集了多种轻量化训练技术及人类对齐训练方法,并支持使用 vLLM 和 LMDeploy 进行加速,同时运用多种技术对大模型量化,且提供了基于 Gradio 的 Web-UI 界面及丰富最佳实践。
2025-05-09 15:00:20
942
原创 Optimum详解
Optimum 是 Hugging Face 提供的 Transformers 和 Diffusers 的扩展库,旨在帮助用户在目标硬件上以最高效率训练和运行模型,同时保持易于使用的特性。
2025-05-08 18:26:18
1369
原创 基于 MeloTTS.cpp 的轻量级的纯 C++ 文本转语音(TTS)库
是一个轻量级的纯 C++ 文本转语音(Text-to-Speech,TTS)库,由 MyShell.ai 开发并发布。它基于 MeloTTS 项目,支持多种语言的语音合成,包括英语、中文(混合英语)以及即将支持的日语等。
2025-04-28 14:32:36
1672
原创 electron-updater实现自动更新
electron-updater 是一个专为 Electron 应用设计的自动更新工具,能够帮助开发者轻松实现跨平台的自动更新功能。它支持 Windows、macOS 和 Linux 系统,通过简单的配置即可集成到 Electron 应用中,自动检查应用的最新版本并在后台完成更新。electron-updater 提供了灵活的更新策略,比如自动下载更新、静默安装,以及在下次启动时应用更新,从而确保用户始终使用最新版本的应用程序。
2025-04-24 19:31:20
1287
原创 Electron打包支持多语言
在项目的构建资源目录(如 build 或 public)中,创建多个许可文件,并在文件名中添加语言代码后缀。:指定安装向导支持的语言列表。例如,["zh_CN", "en_US"] 表示只显示简体中文和英文。打包应用后,安装向导会显示语言选择对话框,且只包含简体中文和英文选项。选择语言后,安装向导会根据选择的语言加载对应的许可文件。license_zh_CN.txt(简体中文):设置为 true,表示创建多语言安装包。:设置为 true,显示语言选择对话框。license_en.txt(英文)
2025-04-15 15:35:39
753
原创 提取app.asar中的资源
通过以上步骤,你可以成功提取 .asar 文件中的资源。如果需要进一步操作或修改文件,可以在解压后进行编辑,完成后可以重新打包为 .asar 文件。首先,确保已安装 Node.js 和 npm。如果 .asar 文件被加固或加密,可能需要额外的工具(如 asar-plus)来解压。确保在解压前备份原始 .asar 文件,以免误操作导致数据丢失。
2025-04-15 10:24:35
1426
原创 electron-builder参数详解
electron-builder 是一个用于打包和构建 Electron 应用的工具,支持 macOS、Windows 和 Linux 平台,并提供了丰富的参数配置选项。
2025-04-14 21:43:50
2043
原创 解决Server doesn‘t support Accept-Ranges问题
当启用时,更新程序会通过多个分段请求(Range: bytes=x-y)来下载更新内容,而不是一次性下载整个文件。如果服务器不支持多段请求(例如某些服务不支持 Content-Type: multipart/byteranges),则需要禁用此选项。这种方式通常通过 blockmap 文件实现,blockmap 文件记录了文件的分块信息(如哈希值和大小),用于确定需要下载的更新内容。差异更新通过对比新旧版本的文件内容,只下载发生变化的部分,从而减少更新包的大小和下载时间。
2025-04-11 11:03:29
624
原创 使用 PresentMon 获取屏幕帧率
PresentMon是一个用于捕获和分析Windows上图形应用程序高性能特性的工具集,最初由GameTechDev开发,现由英特尔维护和推广。PresentMon能够追踪关键性能指标,如CPU、GPU和显示器的帧持续时间和延迟等,并支持多种图形API(如DirectX、OpenGL和Vulkan)以及不同的硬件配置和桌面与UWP应用程序。
2025-03-13 20:59:50
1656
原创 解决Docker Desktop中ext4.vhdx文件过大的问题
ext4.vhdx是Docker Desktop在Windows系统上使用WSL2(Windows Subsystem for Linux 2)时,用于存储Linux文件系统的虚拟硬盘文件。
2025-03-13 20:48:18
1433
原创 使用虚拟声卡播放音频文件作为麦克风声源
VB-CABLE虚拟声卡是一种将电脑播放的声音当作虚拟麦克风输入的工具,可用于语音聊天、直播或录制系统声音等场景。
2025-03-07 19:06:27
5059
原创 python启动关闭进程
subprocess 是 Python 的一个标准库,用于创建和管理子进程。它允许 Python 程序启动新的进程、连接到它们的输入/输出/错误管道,并获取它们的返回码。
2025-02-25 16:51:29
981
原创 基于Electron+Vue3创建桌面应用
Electron 是一个开源框架,基于 Chromium 和 Node.js,用于开发跨平台桌面应用程序。它允许开发者使用 HTML、CSS 和 JavaScript 等 Web 技术构建原生桌面应用,支持 Windows、macOS 和 Linux。Electron 以其开发便捷性、强大的功能和丰富的生态系统而广泛应用于工具类应用、媒体播放器、代码编辑器等领域。
2025-02-17 18:31:52
1172
原创 OpenCV 模板匹配
cv2.matchTemplate 是 OpenCV 中用于模板匹配的函数,它可以在一幅大图像中查找与模板图像相似的区域。以下是关于该函数的详细说明和使用方法:
2025-02-12 18:54:46
1315
原创 DeepSeek本地部署
Ollama 是一个用于运行大型语言模型(如 Llama 3.3、DeepSeek-R1、Phi-4、Gemma 2 等)的框架,支持本地部署和使用。
2025-02-10 16:39:39
1038
原创 使用PyInstaller将Python项目代码打包成exe
PyInstaller 是一个非常强大的工具,用于将 Python 脚本打包成独立的可执行文件(如 .exe 文件),使得 Python 应用程序可以在没有安装 Python 环境的机器上运行。
2025-01-21 20:21:01
1566
原创 微软开源AI Agent AutoGen 详解
AutoGen是微软发布的一个用于构建AI Agent系统的开源框架,旨在简化事件驱动、分布式、可扩展和弹性Agent应用程序的创建过程。
2025-01-16 14:25:12
2068
基于Bert模型实现文本情感分析
2025-06-23
基于RoBERTa模型实现AI生成文本检测
2024-12-08
基于ViT模型实现相似图像检索
2024-11-25
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅