自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(674)
  • 资源 (3)
  • 收藏
  • 关注

原创 基于 OpenVINO GenAI 运行Qwen3-14B模型推理

摘要:英特尔OpenVINOGenAI是专为生成式AI开发优化的工具库,支持在CPU、GPU等英特尔硬件上高效部署多模态应用。本文详细介绍Qwen3-14B-INT4-OV模型的安装、量化和推理流程,包括设备兼容性检查、推理性能指标(如TTFT首token时间)的测量方法,以及如何通过流式生成计算token吞吐量。实验显示该工具能有效简化大语言模型在英特尔平台上的部署,并提供详细的性能分析功能。(148字)

2025-11-12 10:41:56 268

原创 OpenWebUI本地开发指南

本文介绍了Open WebUI项目的开发环境搭建与部署流程。首先需准备操作系统和开发环境(Python 3.11+、Node.js 22.10+),然后克隆代码仓库。前端部分需配置环境变量、安装依赖并启动开发服务,后端建议使用Conda隔离Python环境后启动服务。文章还提供了跨设备联调方法,包括局域网访问配置和CORS白名单设置。最后给出了Linux和Windows系统下的Docker镜像编译脚本,包含端口映射、数据卷挂载等配置参数,支持项目容器化部署。

2025-11-12 10:27:57 299

原创 将火山云TOS存储桶挂载到Linux服务器

摘要:本文介绍了使用Goofys和S3FS工具挂载TOS存储桶的详细步骤及注意事项。主要内容包括:1)安装Goofys/S3FS工具;2)配置密钥文件并执行挂载命令;3)验证挂载结果;4)常见问题排查方法。特别强调S3FS性能限制、多客户端协调问题,以及生产环境推荐使用API而非挂载方式。文中提供了完整的命令示例和关键参数说明,并指出TOS仅支持VirtualStyle访问方式。

2025-10-28 18:10:32 736

原创 使用Optimum-habana对LLM模型训练推理

摘要:optimum-habana是连接Transformers/Diffusers库与Intel Gaudi AI加速器(HPU)的接口工具,支持单卡和多卡环境下的模型训练与推理。它提供已验证支持的多种主流模型架构(如BERT、GPT、Llama等)及任务类型(文本生成、问答等)。文档详细介绍了Docker环境搭建、依赖安装方法,以及单卡/多卡训练、LoRA微调和模型推理的具体配置参数,特别是针对大语言模型(如Llama-2 70B)的分布式训练优化方案。

2025-09-26 19:54:00 1131

原创 统计用户的N日留存

N日留存率是衡量用户留存的关键指标,计算公式为指定日期新增用户中在N天后仍活跃的用户占比。与"最近N日活跃"不同,N日留存聚焦特定同期群在精确时间点的留存表现。SQL示例通过三步骤实现7日留存计算:1)识别用户首访日期;2)记录用户活跃日期;3)关联数据计算留存率。该方法能准确评估新用户7天后的留存情况,反映产品粘性。(147字)

2025-09-23 10:50:54 240

原创 Llama-Factory微调 Qwen2.5-VL-3B 模型

本文详细介绍了Qwen2.5-VL-3B多模态模型的LoRA微调全流程。首先说明硬件需求(3B模型约需8-12GB显存)和环境搭建步骤,包括创建虚拟环境、安装依赖项和下载模型。重点阐述了多模态数据集准备规范(JSON格式+图像目录)和数据集注册方法。推荐使用LoRA轻量级微调以降低显存需求,提供了命令行和WebUI两种训练方式及详细参数配置。最后介绍模型测试、导出方法和常见问题解决方案,特别强调数据质量、显存优化和模型兼容性等关键注意事项。

2025-08-21 19:57:01 1225

原创 LTM框架Letta

Letta是一个开源框架,用于构建具有长期记忆和高级推理能力的有状态AI代理。框架支持多种模型和数据库,安装后可通过环境变量配置LLM和嵌入模型。提供本地服务器运行和Web开发环境(ADE),支持API接口管理代理,包括创建、查询和交互功能。兼容SQLite和PostgreSQL,支持Ollama等本地模型部署。开发者可通过REST API或Python客户端实现代理管理,适用于构建复杂的对话系统和智能应用。

2025-08-21 19:22:58 523

原创 基于SIFT/ORB计算图像的旋转角度和缩放比例

文章摘要:本文介绍了通过特征点匹配计算图像间旋转角度的方法。使用SIFT或ORB算法提取特征点,BFMatcher进行匹配,再用estimateAffinePartial2D函数计算仿射变换矩阵,从中提取旋转角度和缩放比例。提供了完整的SIFT和ORB实现代码,并指出特征匹配质量、旋转角度范围和算法性能等注意事项。该方法适用于图像处理中的旋转检测,可根据实际需求选择不同特征提取算法。

2025-08-20 09:56:55 433

原创 Windows下搭建Ubuntu系统并部署Python环境

摘要:本文介绍了WSL安装配置全过程。首先通过PowerShell启用WSL并安装Ubuntu分发版,随后配置挂载目录权限。接着安装Python3.12及必要开发工具,创建虚拟环境并配置pip清华源。然后安装CUDA工具包验证环境,修改pip缓存路径。最后详细说明如何迁移WSL的ext4.vhdx文件到新位置,包括导出、卸载和重新导入等步骤。整个流程涵盖从基础环境搭建到深度学习工具链配置,并提供了关键配置文件的修改方法。

2025-08-20 09:54:02 422

原创 Qwen2.5-VL-3B模型4bit推理

阿里巴巴推出新一代多模态模型Qwen2.5-VL,支持图像、文本和视频理解,具备更强的代理决策能力。该模型采用优化架构,支持结构化输出,在文档图表理解和视频分析任务中表现优异。提供3B到72B多种规模版本,其中3B模型经量化后可在8GB显存设备运行。文章详细介绍了模型特性、硬件要求、部署方法及输入格式限制,并提供了4-bit量化推理的代码示例和显存优化建议。

2025-08-06 00:37:15 1283

原创 使用BART模型和T5模型实现文本改写

摘要:BART和T5是两种主流的预训练语言模型,均采用编解码架构。BART结合BERT的双向编码和GPT的自回归解码,通过文本破坏还原任务预训练,适用于生成和理解任务。T5提出统一文本到文本框架,所有任务均转换为text-to-text形式,采用span掩码预训练。两者都支持多种下游任务,BART更侧重生成,T5强调任务统一性。中文场景下可通过微调实现文本改写等功能,典型实现使用HuggingFace的transformers库加载预训练权重进行推理。

2025-08-01 20:08:30 989

原创 Android使用MediaProjectionManager获取游戏画面和投屏

Android系统通过MediaProjectionManager实现屏幕录制和截屏功能,需先获取用户授权。主要步骤包括:获取管理器实例、创建权限请求Intent、处理授权结果并获取MediaProjection对象。关键是通过createVirtualDisplay()创建虚拟显示,需指定屏幕参数和渲染目标Surface。使用注意事项包括版本适配、权限管理、资源释放等,特别在Android14+需注意令牌的单次使用限制。该功能为开发者提供了灵活的屏幕内容捕获方案,可用于录制、截图等场景。

2025-08-01 20:01:05 700

原创 使用 Canvas 替代 <video> 标签加载并渲染视频

本文提出了一种基于WebGPU+Canvas2D的高性能视频渲染方案,解决传统video标签首帧延迟问题。核心思路是将视频解码与渲染分离:隐藏的video标签负责解码,WebGPU通过importExternalTexture获取视频帧纹理,配合Canvas2D实现高效渲染。方案采用requestVideoFrameCallback优先的帧同步机制,动态调整画布尺寸,并复用WebGPU对象(纹理、绑定组等)提升性能,最终构建出跨平台、低延迟的视频播放管线。关键实现包括视频帧回

2025-07-29 23:51:02 571

原创 YOLOv11.pt 模型转换为 TFLite 和 NCNN 模型

鉴于 Windows 的兼容性问题,强烈建议使用 Google Colab,因为它提供 Linux 环境,预装 CUDA,兼容 ai_edge_litert。只需上传模型和脚本,安装依赖即可完成转换。

2025-07-29 23:48:38 835

原创 Electron将视频文件单独打包成asar并调用

本文将介绍如何将视频文件打包到单独的asar包中并让Electron应用正常调用。首先调整项目结构,将视频文件单独存放;然后使用asar命令打包视频文件;接着修改forge.config.js配置,设置asar选项并忽略视频目录;在主进程中注册自定义协议处理asar文件资源;最后在渲染进程中通过注册的协议引用视频文件。关键步骤包括asar打包、协议注册和CSP策略设置,确保视频资源能通过app://协议正常访问。

2025-07-29 23:44:56 367

原创 图像特征检测算法ORB

ORB(Oriented FAST and Rotated BRIEF)是一种在计算机视觉领域广泛应用的特征检测与描述算法。

2025-06-19 18:00:49 715

原创 图像特征检测算法SIFT

SIFT(Scale - Invariant Feature Transform,尺度不变特征变换)是一种计算机视觉领域的特征提取算法,具有重要的地位和广泛的应用。

2025-06-19 17:52:40 1080

原创 图像特征检测算法SuperPoint和SuperGlue

SuperPoint 是一个自监督的全卷积神经网络,用于提取图像中的兴趣点及其描述子。它在 2018 年由 Magic Leap 提出,通过在合成数据集上预训练一个基础检测器 MagicPoint,然后利用同胚适应技术对真实图像数据集进行标记,从而得到一个增强的检测器 SuperPoint,使其在真实世界图像上具有可靠性。

2025-06-17 19:34:52 1155

原创 Python去除图像背景

rembg 是一个开源的 Python 库,专门用于去除图像背景,它利用深度神经网络能够准确地识别并去除图像背景,使用户无需进行复杂的手动编辑,只需几行代码即可获得专业效果。Rembg 基于 U2-Net 架构,有多种架构修改和经过测试的方法以提供最佳结果,还提供对 GPU 安装的访问以实现更快的处理。

2025-06-17 19:14:52 301

原创 图像特征检测算法

图像特征检测是计算机视觉的基础技术,用于提取图像中的关键信息。传统算法包括SIFT(高鲁棒性但计算慢)、SURF(SIFT的加速版本)、ORB(实时性强)、Harris角点检测(简单高效)和FAST(极速检测)。边缘检测算法如Canny可提取连续轮廓,HOG和LBP分别适用于形状和纹理特征。深度学习方法如CNN和SuperPoint通过端到端学习实现更高精度。算法选择需权衡速度、精度和应用场景,当前趋势是深度学习主导、轻量化部署和多模态融合。传统与深度学习方法正在融合,以构建更高效的视觉系统。

2025-06-17 19:12:20 1058

原创 使用 LSTM/GRU 预测设备异常的模型

LSTM 和 GRU 都被广泛应用于自然语言处理、时间序列预测、语音识别等领域。LSTM 由于其强大的长期依赖建模能力,在需要处理长序列数据时通常表现更好,但计算成本较高。而 GRU 在一些对实时性要求较高或计算资源有限的场景下,由于其结构简单、计算效率高,可能会成为更优的选择。

2025-05-16 16:40:56 1182

原创 使用 swift 微调 Qwen3-4b 模型

Qwen3 推荐使用 Axolotl、UnSloth、Swift、Llama-Factory 等训练框架来进行 SFT、DPO、GRPO 等微调模型的处理。魔搭社区提供的 ms-swift 框架,支持 500 多种大模型与 200 多种多模态大模型的训练、推理、评测、量化与部署,涵盖众多知名模型。它还汇集了多种轻量化训练技术及人类对齐训练方法,并支持使用 vLLM 和 LMDeploy 进行加速,同时运用多种技术对大模型量化,且提供了基于 Gradio 的 Web-UI 界面及丰富最佳实践。

2025-05-09 15:00:20 942

原创 Optimum详解

Optimum 是 Hugging Face 提供的 Transformers 和 Diffusers 的扩展库,旨在帮助用户在目标硬件上以最高效率训练和运行模型,同时保持易于使用的特性。

2025-05-08 18:26:18 1369

原创 基于 MeloTTS.cpp 的轻量级的纯 C++ 文本转语音(TTS)库

是一个轻量级的纯 C++ 文本转语音(Text-to-Speech,TTS)库,由 MyShell.ai 开发并发布。它基于 MeloTTS 项目,支持多种语言的语音合成,包括英语、中文(混合英语)以及即将支持的日语等。

2025-04-28 14:32:36 1672

原创 electron-updater实现自动更新

electron-updater 是一个专为 Electron 应用设计的自动更新工具,能够帮助开发者轻松实现跨平台的自动更新功能。它支持 Windows、macOS 和 Linux 系统,通过简单的配置即可集成到 Electron 应用中,自动检查应用的最新版本并在后台完成更新。electron-updater 提供了灵活的更新策略,比如自动下载更新、静默安装,以及在下次启动时应用更新,从而确保用户始终使用最新版本的应用程序。

2025-04-24 19:31:20 1287

原创 Electron打包支持多语言

在项目的构建资源目录(如 build 或 public)中,创建多个许可文件,并在文件名中添加语言代码后缀。:指定安装向导支持的语言列表。例如,["zh_CN", "en_US"] 表示只显示简体中文和英文。打包应用后,安装向导会显示语言选择对话框,且只包含简体中文和英文选项。选择语言后,安装向导会根据选择的语言加载对应的许可文件。license_zh_CN.txt(简体中文):设置为 true,表示创建多语言安装包。:设置为 true,显示语言选择对话框。license_en.txt(英文)

2025-04-15 15:35:39 753

原创 提取app.asar中的资源

通过以上步骤,你可以成功提取 .asar 文件中的资源。如果需要进一步操作或修改文件,可以在解压后进行编辑,完成后可以重新打包为 .asar 文件。首先,确保已安装 Node.js 和 npm。如果 .asar 文件被加固或加密,可能需要额外的工具(如 asar-plus)来解压。确保在解压前备份原始 .asar 文件,以免误操作导致数据丢失。

2025-04-15 10:24:35 1426

原创 electron-builder参数详解

electron-builder 是一个用于打包和构建 Electron 应用的工具,支持 macOS、Windows 和 Linux 平台,并提供了丰富的参数配置选项。

2025-04-14 21:43:50 2043

原创 解决Server doesn‘t support Accept-Ranges问题

当启用时,更新程序会通过多个分段请求(Range: bytes=x-y)来下载更新内容,而不是一次性下载整个文件。如果服务器不支持多段请求(例如某些服务不支持 Content-Type: multipart/byteranges),则需要禁用此选项。这种方式通常通过 blockmap 文件实现,blockmap 文件记录了文件的分块信息(如哈希值和大小),用于确定需要下载的更新内容。差异更新通过对比新旧版本的文件内容,只下载发生变化的部分,从而减少更新包的大小和下载时间。

2025-04-11 11:03:29 624

原创 使用multiprocessing实现进程间共享内存

在 Python 中,可以使用多种方法来实现几个进程之间的通信。

2025-03-14 20:45:28 713

原创 使用 PresentMon 获取屏幕帧率

PresentMon是一个用于捕获和分析Windows上图形应用程序高性能特性的工具集,最初由GameTechDev开发,现由英特尔维护和推广。PresentMon能够追踪关键性能指标,如CPU、GPU和显示器的帧持续时间和延迟等,并支持多种图形API(如DirectX、OpenGL和Vulkan)以及不同的硬件配置和桌面与UWP应用程序。

2025-03-13 20:59:50 1656

原创 解决Docker Desktop中ext4.vhdx文件过大的问题

ext4.vhdx是Docker Desktop在Windows系统上使用WSL2(Windows Subsystem for Linux 2)时,用于存储Linux文件系统的虚拟硬盘文件。

2025-03-13 20:48:18 1433

原创 使用虚拟声卡播放音频文件作为麦克风声源

VB-CABLE虚拟声卡是一种将电脑播放的声音当作虚拟麦克风输入的工具,可用于语音聊天、直播或录制系统声音等场景。

2025-03-07 19:06:27 5059

原创 通过命令启动steam的游戏

在Windows系统中,可以通过命令行启动Steam游戏

2025-02-25 18:39:15 5653

原创 python启动关闭进程

subprocess 是 Python 的一个标准库,用于创建和管理子进程。它允许 Python 程序启动新的进程、连接到它们的输入/输出/错误管道,并获取它们的返回码。

2025-02-25 16:51:29 981

原创 基于Electron+Vue3创建桌面应用

Electron 是一个开源框架,基于 Chromium 和 Node.js,用于开发跨平台桌面应用程序。它允许开发者使用 HTML、CSS 和 JavaScript 等 Web 技术构建原生桌面应用,支持 Windows、macOS 和 Linux。Electron 以其开发便捷性、强大的功能和丰富的生态系统而广泛应用于工具类应用、媒体播放器、代码编辑器等领域。

2025-02-17 18:31:52 1172

原创 OpenCV 模板匹配

cv2.matchTemplate 是 OpenCV 中用于模板匹配的函数,它可以在一幅大图像中查找与模板图像相似的区域。以下是关于该函数的详细说明和使用方法:

2025-02-12 18:54:46 1315

原创 DeepSeek本地部署

Ollama 是一个用于运行大型语言模型(如 Llama 3.3、DeepSeek-R1、Phi-4、Gemma 2 等)的框架,支持本地部署和使用。

2025-02-10 16:39:39 1038

原创 使用PyInstaller将Python项目代码打包成exe

PyInstaller 是一个非常强大的工具,用于将 Python 脚本打包成独立的可执行文件(如 .exe 文件),使得 Python 应用程序可以在没有安装 Python 环境的机器上运行。

2025-01-21 20:21:01 1566

原创 微软开源AI Agent AutoGen 详解

AutoGen是微软发布的一个用于构建AI Agent系统的开源框架,旨在简化事件驱动、分布式、可扩展和弹性Agent应用程序的创建过程。

2025-01-16 14:25:12 2068

基于Bert模型实现文本情感分析

本代码使用Bert模型,我们可以有效地检测文本情感分析。 Bert通过在大规模文本语料库上进行无监督预训练,学习语言的通用特征。主要训练任务包括masked language model(MLM)和next sentence prediction(NSP)。在MLM任务中,随机掩盖输入句子中的一些单词,然后让模型预测这些被掩盖的单词,使模型能够理解单词之间的上下文关系;NSP任务则是让模型判断两个句子是否是连续的,帮助模型理解句子之间的逻辑关系。 在预训练完成后,Bert可以根据具体的NLP任务进行微调。通过对预训练模型进行进一步的训练,使其适应情感分析任务。在微调过程中,会根据任务的特点添加相应的输出层,并对整个模型进行端到端的训练。

2025-06-23

基于RoBERTa模型实现AI生成文本检测

本代码使用RoBERTa模型,我们可以有效地检测AI生成的文本。 RoBERTa(Robustly optimized BERT approach)是BERT的一个优化版本,通过对大量数据进行预训练,它在各种自然语言处理任务上都取得了显著的性能提升。 主要步骤:包括数据预处理、模型和优化器的初始化、训练过程、验证与早停机制以及评估函数。

2024-12-08

基于ViT模型实现相似图像检索

本代码基于深度学习实现图像检索,它利用Vision Transformer(ViT)模型来提取图像特征,并执行相似度比较以找到最匹配的图像。系统的核心功能是通过比较查询图像与数据库中图像的特征向量,来检索出与查询图像最相似的图像。 核心组件 预处理:图像在送入模型之前会经过一系列的预处理步骤,包括调整大小、中心裁剪、转换为张量以及归一化。 特征提取:使用预训练的Vision Transformer模型(vit_b_16)来从预处理后的图像中提取特征向量。这里假设模型的输出可以作为图像的特征表示。 余弦相似度计算:系统使用余弦相似度来衡量两个特征向量之间的相似度,这是一种常用于比较向量相似度的方法。 数据库构建:系统会遍历指定的数据集目录,对每个图像文件执行特征提取,并将特征存储在内存中以便于后续检索。 图像检索:给定一个查询图像,系统会计算其特征与数据库中每个图像特征的相似度,并返回最相似的图像列表。

2024-11-25

iOS生物识别FaceID&TouchID

iOS的指纹识别验证与面部识别验证,调用系统的LocalAuthentication.framework,封装完整。

2020-10-19

iOS生成二维码 QRCodeView

iOS生成二维码 QRCodeView 封装完整,可以展示二维码或者生成二维码图片,使用原生滤镜CIFilter生成二维码。

2020-10-19

IOS环形进度条

IOS环形进度条,可自定义环形进度条的时间、半径、颜色等等。

2014-11-16

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除