批量小王子-优快云博客

原创 2025-08-19利用opencv检测图片中文字及图片的坐标

该代码实现了图片中中文文本的检测与位置计算功能。主要使用CnOcr库进行OCR识别，结合OpenCV和PIL库处理图像。功能包括：1)检测图片中的中文文本及位置坐标；2)计算每个文本的像素宽度和高度；3)在原图上绘制文本边界框并标注识别结果。代码通过put_chinese_text函数解决中文显示问题，最终输出各文本内容、坐标位置及尺寸信息。适用于需要获取图片中文字精确位置的应用场景。

2025-08-19 15:40:23 187

原创 2025-8-19查看单张图片某个点的xy值坐标

该Python脚本使用OpenCV库实现图像坐标点查看功能，主要用于排版和设计时的精确控制。通过cv2.imshow()显示图像窗口，并设置鼠标回调函数show_with_click，当用户点击图像时，会输出点击位置的X/Y坐标和该点的BGR像素值。该工具可帮助设计师直观地调整字号、图形大小和排版位置。代码简洁实用，按任意键可关闭窗口。

2025-08-19 14:39:37 102

本文介绍了一个基于人脸检测的智能图片裁剪工具。该工具使用MTCNN模型检测图片中的人脸，自动计算最佳裁剪区域，并将结果调整为标准尺寸(295×413)。主要功能包括：1) 单张图片处理(smart_crop)，可检测人脸并保持比例裁剪；2) 批量处理(batch_smart_crop)，支持对指定文件夹中的所有图片进行自动处理。程序会自动调整裁剪框大小，确保人脸居中，并处理边界情况。输出结果保存为统一尺寸的图片，适合制作证件照等标准化图像处理需求。

2025-08-18 13:22:10 506

原创 2025-08-16批量抠图（人像，动物）

这款批量抠图工具采用Python开发，基于rembg库实现高效背景去除功能。代码支持批量处理JPG、PNG等多种格式图片，自动转换为透明背景PNG格式。通过图像模式转换和字节流处理确保抠图质量，特别适合需要处理大量人物或动物图片的场景。工具提供完整的输入输出文件夹管理，自动创建目录并统一输出为PNG格式，简化了电商设计、内容创作中的批量抠图流程。

2025-08-16 15:58:09 71

原创 2025-08-11批量创建 Pin 图

本文介绍了在Pinterest批量创建Pin图的方法：1）将账号免费升级为企业账号；2）通过批量创建功能上传CSV模板文件；3）提供CSV模板下载链接和示例；4）说明每天200个Pin图的限制；5）建议遇到问题时查看官方帮助文档。整个过程从账号升级到批量上传都有详细指引，适合需要批量发布内容的用户参考。

2025-08-11 18:03:04 217

原创 2025-08-09独立虚拟环境+py文件运行方式（亲测可行）

要让不懂编程的用户使用fat.py脚本和虚拟环境env，最简单的方案是：创建一个run.bat文件（内容如上），双击即可运行将env文件夹、fat.py和run.bat一起打包成zip发给用户用户只需解压后双击run.bat即可使用更优方案是使用PyInstaller等工具将脚本打包成exe文件，这样用户只需双击exe即可运行，无需安装Python环境。但打包过程需要一定的技术操作。

2025-08-09 00:37:30 180

原创 2025-08-06如何批量下载pinterset官网高清原图作品集图片

3-pinterest图片下载器链接: https://pan.baidu.com/s/1O2kO3xDONVH0YeJ92EFHew 提取码: uuib。必须安装chorme谷歌浏览器，同时要自行解决科学上网，如果不能正常访问behance网站那么该程序也是无法正常下载图片。使用过程有任何问题可以联系沟通。

2025-08-06 00:53:30 302

原创 2025-08-05Gitee + PicGo + Typora搭建免费图床

本文介绍了使用Gitee+PicGo+Typora搭建图床的完整方案。该方案优势在于Gitee是国内平台，5GB免费空间适合个人使用，配合PicGo和Typora可实现图片自动上传。具体步骤包括：注册Gitee并创建仓库、生成私人令牌、安装node.js和PicGo、配置PicGo的Gitee插件、在Typora中设置图片上传服务。文章还详细说明了每个操作步骤的截图指引，包括仓库创建、插件安装、token获取等关键环节，并提供了问题排查方法（如设置时间戳）。最后指出该方案的主要缺点是存储空间有限且无付费扩容

2025-08-05 17:59:34 417

原创 2025-08-03如何批量下载behance官网高清原图作品集图片

使用说明第1步：必须安装chorme谷歌浏览器，同时要自行解决科学上网，如果不能正常访问behance网站那么该程序也是无法正常下载图片第2步：双击BehanceDownloader.exe文件，第3步：打开目标网站，选择需要下载的作品并复制作品地址到exe文件输入框；第4步：程序会自动打开chorme谷歌浏览器访问输入的作品地址；第5步：自动下载作品所有图片，根据作品标题自动创建图片文件夹；第6步：检查下载的图片；都是高清的原图；接下来演示多作品批量下载的

2025-08-03 02:13:10 94

原创 2025-07-30豆包图生图

本文通过系列图片展示了某技术项目或产品的开发过程。图片内容依次呈现了系统界面设计、功能模块展示、操作流程演示等环节，包括初始界面布局、参数设置面板、运行状态监控等关键环节。最后两张图片着重展示了系统的最终效果展示和性能测试结果。整个图片序列完整记录了从设计到实现的全过程，体现了系统良好的交互性和功能性，为读者提供了直观的项目展示。

2025-07-31 01:03:17 91

原创 2025-07-29利用AI按已有平面设计作品进行洗稿

AI洗稿技术实现多风格图文迁移通过人工智能技术，可将原始图文内容进行风格迁移和内容重构。系统支持多种处理模式：1）保持原主题和场景，对文字进行AI二次创作；2）完全转换视觉风格，生成不同艺术效果的新图像；3）混合模式，同时调整文本和图像风格。演示案例显示，同一组素材可输出卡通插画、水彩风格、极简线条等多种表现形式，文字内容也相应进行了语义保留的改写。该技术适用于内容创作、设计辅助等领域，能快速生成多样化衍生作品。

2025-07-29 14:50:33 127

原创 2025-07-27脚本打包分发技巧（亲测可行）

要让非技术用户顺利运行你的Python脚本，推荐两种简单方法：批处理脚本方案：将fat.py和env文件夹放在同一目录创建run.bat文件（Windows）包含激活虚拟环境和运行脚本的命令压缩整个文件夹发送给用户，用户只需解压后双击run.bat 打包成可执行文件：使用PyInstaller将脚本打包为独立exe文件命令：pyinstaller --onefile fat.py 直接发送生成的exe文件给用户，无需任何额外操作注意事项：建议提供简明的README说明操作步骤虚拟环境可能存

2025-07-27 01:11:41 426

原创 2025-07-26.bat分发方式（待解决）问题

本文介绍了一种通过.bat文件打包Python程序及其虚拟环境的方法，替代传统的pyinstaller打包方式。操作步骤简单：在VSCode中运行指令后，系统会自动生成包含所有依赖项、虚拟环境和批处理文件的压缩包。用户只需解压后双击.bat文件即可运行程序。文中以Behance图片下载器为例，展示了自动生成的使用说明书内容，包含功能特点、操作步骤和注意事项等。这种方法简化了部署流程，特别适合需要完整虚拟环境的Python应用分发。

2025-07-26 22:35:24 211

原创 2025-07-26如何在cline中调用qwen-coder-plus模型

本文介绍了在阿里云平台获取和使用API Key的步骤：首先登录阿里云官网，然后在"Model Studio"中创建API Key；接着通过命令行工具(cline)配置该密钥；最后可在控制台查看API调用情况和使用统计。操作过程配有可视化界面截图指引，帮助用户快速完成API的申请与配置。

2025-07-26 12:54:35 377

原创 2025-07-25设置使用权限N次内

本文介绍了一个带有试用次数限制的文件批量重命名工具。该工具使用AES加密存储试用次数信息，默认允许3次试用。主要功能包括：1)检测并管理加密的授权文件；2)执行文件批量重命名操作；3)自动更新试用次数。当超过试用次数时，会显示开发者联系信息并阻止程序运行。核心代码实现了AES加密/解密功能、试用次数检测和文件重命名逻辑，使用前需配置密钥和授权文件路径。

2025-07-25 21:53:31 860

原创 2025-07-23vscode+cline使用笔记

本文介绍了cline工具的安装与使用指南。首先展示安装成功的截图，然后说明中文插件的安装步骤。基本使用技巧包括：1）打开项目；2）通过Ctrl+Shift+p切换虚拟环境；3）运行程序。重点强调了模型设置步骤，通过多张截图详细说明操作流程。最后讨论了plan与act模式的区别，并提示需要明确理解相关问题。全文配有详细的操作截图，为使用者提供了直观的安装和使用指导。

2025-07-23 18:41:58 334

原创 2025-07-16图片去重，虽然命名不一样但可以去掉相同的图片

本文提供了两个Python脚本用于检测和删除重复图片。第一个脚本针对单个文件夹，使用感知哈希算法(phash)计算图片特征值，通过比较哈希值识别重复图片并删除。第二个脚本扩展功能至处理指定目录及其所有子目录中的图片文件。两个脚本均支持常见图片格式(.png/.jpg等)，包含错误处理机制，并输出删除文件统计。使用时需修改目标文件夹路径参数，适合需要批量清理重复图片的场景。

2025-07-16 17:04:19 263

原创 2025-07-16文字语义搜索本地图片（待完善）

本文探讨了如何在本地建立基于语义的图片空间分类系统，主要针对卧室、客厅等空间类型的图片检索。方案采用CLIP模型进行图文特征提取，结合FAISS实现向量检索，并搭建Flask前端展示。为提高识别精度，建议增加批量空间标签识别（使用ResNet或GPT-4Vision自动打标）和多条件过滤功能。文中提供了一个基础实现代码示例，使用CLIP模型计算图片与空间标签的匹配概率，但指出当前识别精度有限，需要进一步优化模型和方案。系统设计考虑了大图库场景，支持超过10万张图片的索引管理。

2025-07-16 11:07:13 393

原创 2025-07-16小规模人工标注（30张主卧设计绝对美/丑图）快速验证

本文介绍了一个基于ResNet18的小样本二分类模型实现，用于图像美学评分。代码实现了完整流程：1)数据加载与预处理，使用ImageFolder加载"beautiful/ugly"二分类训练数据；2)模型构建与微调，采用预训练ResNet18并微调全模型；3)训练过程，使用交叉熵损失和Adam优化器；4)预测功能，对测试图像输出美学评分（0-1概率值）。模型训练后支持批量评分和结果保存为CSV文件。作者建议根据效果选择后续优化方向：表现好则扩充数据集，效果一般可改用NIMA美学模型。代码

2025-07-16 01:55:47 224

原创 2025-07-15通过边缘线检测图像里的主体有没有出血

文章摘要：本文探讨了AI时代精准提问的重要性，指出90%的问题解决在于正确描述问题。作者以筛选"出血图片"为例，展示了三次提问迭代过程，最终通过明确定义"出血"标准（边缘接触线数量、最小长度等）和中文路径处理，使AI生成的代码准确率达到95%。文章对比了国内外AI表现，指出国产AI在中文路径处理等基础问题上仍有差距。最后提供了完整的Python实现代码，包括图像边缘检测、轮廓分析和文件移动功能。

2025-07-15 19:36:33 704 1

原创 2025-07-14如何批量下载behance网站里的图片？

本文介绍了通过浏览器开发者工具批量下载网页图片的操作步骤：1)右击页面选择"检查"打开开发者工具；2)切换至"Network"网络面板；3)筛选"img"图片资源；4)滚动页面加载全部图片；5)点击目标图片查看详情；6)右键保存图片。文末提示如需批量下载可留言咨询。该教程图文并茂地演示了利用开发者工具抓取网页图片的完整流程，适用于需要保存网页图片素材的场景。（135字）

2025-07-14 17:38:28 565

原创 2025-07-13对比两分txt不同处并标注出来

本文介绍了一个Python脚本，用于比较两个文本文件的差异并以加粗标记形式输出。该脚本使用difflib库进行字符级差异比较，将不同之处用加粗显示，相同内容保持原样。功能包括：逐行比较文件内容、标记差异字符、处理不等长文件剩余行。输出结果包含行号、原始内容和差异对比，以60个"-"分隔不同比较结果。适用于需要直观显示文本差异的场景，如代码或文档对比。

2025-07-13 21:42:12 156

原创 2025-07-08【计算机视觉搜索】从1000张户型图中找出最相似的TOP5

摘要：该代码实现了一个基于ResNet50特征提取和Faiss向量检索的户型图相似度搜索系统。系统首先构建图库索引，使用预训练的ResNet50模型（去掉分类层）提取图像特征并归一化，然后将特征向量存入Faiss的L2距离索引。用户上传图片后，系统提取其特征并在索引中搜索最相似的TOP_K张图。代码支持中文路径处理，包含图像预处理、特征提取、索引构建和相似度搜索全流程，最终输出相似图片路径及相似度评分。该系统可用于户型推荐、装修案例匹配等场景。

2025-07-08 23:24:03 87

原创 2025-06-26【数据】批量提取bilibili的视频列表

本文介绍了如何从Bilibili课程页面提取视频标题的Python实现方法。首先需要获取网页HTML源代码，然后通过正则表达式匹配包含标题的div标签。代码提供了完整的提取流程：1)读取HTML文件；2)使用正则表达式提取title属性内容；3)将结果保存到txt文件。程序包含错误处理机制，会提示文件未找到或其他异常情况。运行后会将提取的100个课程标题按序号输出并保存，适合需要批量获取网页内容的开发者使用。

2025-06-26 01:39:24 361

原创 2025-06-18【视觉处理】特征金字塔FPN方法：多尺寸查找小图是否存在大图中

基于深度学习的多尺度图像匹配算法研究本文提出了一种基于FPN（特征金字塔网络）和ResNet50的多尺度图像匹配方法。通过构建共享权重的FPN骨干网络，实现了对输入图像的多层级特征提取；利用L2归一化层提升特征匹配的鲁棒性；采用组卷积高效计算余弦相似度响应图，并通过多尺度响应融合策略综合不同层级的匹配结果。实验结果表明，该方法能够有效处理不同尺度图像间的匹配问题，并通过可视化响应热力图直观展示匹配效果。代码实现包含完整的预处理、特征提取、响应计算和结果可视化流程，为图像匹配任务提供了一种高效的解决方案。

2025-06-18 15:21:44 132

原创 2025-06-17（思考）什么是相似性搜索？

想象一下，你是一个画画的艺术家，你画了一幅画，但你不确定它和别人画的哪一幅“最像”。你不想一个一个地看别人的作品，你希望有一个“聪明的小助手”帮你找到“最像”的那幅画。这就是“相似性搜索”的作用。相似性搜索就像一个“聪明的小助手”，它能帮你找到“最像”的作品。它在艺术创作中有很多用处，比如找灵感、找风格、展示作品等等。它通过给每幅画打“标签”来比较它们，然后找到最像的那个。虽然它现在还在学习，但未来会越来越聪明、越来越快！

2025-06-18 00:18:06 244

原创 2026-06-14【视觉】python精准匹配模式：判断大图中包含小图并输出位置

这篇文章介绍了使用Python和OpenCV进行基于SIFT特征的图像匹配方法。通过SIFT算法检测并提取小图(模板)和大图的关键点和描述符，然后使用BFMatcher进行KNN匹配，并通过比率测试筛选高质量匹配点。当匹配点数量超过阈值(如8个)时，判断小图可能包含在大图中，并可视化匹配结果；否则提示未找到足够匹配点。该方法可用于图像识别和内容检索等应用场景。

2025-06-15 02:10:01 307

原创 2025-06-14【视觉】使用边缘检测和轮廓匹配在大图中查找小图（非常好）

本文介绍了一个基于边缘检测和轮廓匹配的图像查找方法。该方法通过Canny边缘检测提取图像特征，利用轮廓匹配技术在大图中定位小图位置。核心步骤包括：图像灰度化、高斯模糊去噪、边缘检测、轮廓提取和匹配评分。程序采用OpenCV实现，支持可视化匹配结果，包含匹配分数和定位框。主要参数可调节边缘检测阈值、轮廓匹配阈值和最小面积比例，适用于不同场景的图像匹配需求。该方法特别适合处理具有明显边缘特征的图像匹配问题。

2025-06-15 01:56:44 375

原创 2025-06-14【视觉】视频转化为图集

本文介绍了一个使用多线程和进度条将视频转换为图片序列的Python脚本。该脚本主要功能包括：1) 以时间格式(时_分_秒_毫秒)或帧索引命名输出图片；2) 通过ThreadPoolExecutor实现多线程处理加速；3) 使用tqdm库显示处理进度条；4) 支持设置帧间隔提取。脚本通过OpenCV读取视频帧，计算时间戳，并以并行的方式保存为图片文件，适用于视频帧分析、时间标注等场景，处理进度可视化且效率较高。

2025-06-14 23:21:32 352

原创 2025-06-14【视觉】批量筛选图集中包含某种物体对象的方法

文章摘要：该代码实现了一个图像匹配系统，用于在大图文件夹中查找包含指定模板小图的图片。核心功能包括：支持中文路径的图像读取（imread_chinese），使用ORB算法进行特征匹配（find_template_in_image），以及遍历文件夹筛选匹配图片（find_images_containing_template）。系统会将匹配成功的图片保存到指定目录，并输出匹配结果列表。代码采用了OpenCV的ORB特征检测器和暴力匹配器，通过设定距离阈值来判断匹配程度，最终筛选出包含模板的大图。示例图片显示有

2025-06-14 22:54:16 294

原创 2025-06-14[避坑]解决不支持中文路径读取图像的方法

摘要： OpenCV的cv2.imread()在处理含中文路径的图片时出现警告，提示无法读取文件。问题根源在于Windows系统中某些OpenCV版本不支持Unicode路径。解决方案是改用Pillow库读取图片后转为OpenCV格式，并提供了imread_chinese()函数代码示例。其他建议包括：避免中文路径名、检查文件完整性、添加日志记录和保持路径兼容性。该方法能有效解决中文路径导致的图像读取问题。

2025-06-14 22:36:47 609

原创 2025-06-13【视频处理】基于视频内容转场进行分割

摘要：本文探讨了从合并视频中精确分割不同场景片段的方法。通过分析视觉特征（图像帧）、音频信号和语义内容，利用PySceneDetect工具包自动检测场景切换点。文章提供了详细的Python实现代码，包括场景检测、视频裁剪和导出功能。针对不同视频特性，可调整敏感度阈值（15-45）优化分割效果。同时指出可能遇到的问题（如虚假切换、内容变化无画面改变等），并建议结合深度学习模型和音频分析来提升分割精度。该方法适用于讲解类、教程类视频的自动化处理，可实现高效精准的片段提取。

2025-06-13 23:54:25 1056

原创 2025-06-13【api】阿里百炼api调用方法

本文展示了三种调用大模型API实现图像理解的方法，均基于阿里云DashScope平台。方法一通过环境变量配置API密钥，方法二直接写入密钥，方法三支持本地图片识别（需base64编码）。三种方式均使用"qwen-vl-max-latest"模型，可完成图片内容描述、风格识别等任务，代码示例完整展现了从初始化客户端到解析返回结果的全流程。这些方法适用于文生文、文生图、多模态理解等AI应用场景。

2025-06-13 00:14:53 527

原创 2025-06-11[批量裁剪素材视频]

本文介绍了一个使用FFmpeg进行视频批量处理的Python脚本。该脚本主要功能包括：1)获取视频原始尺寸和时长；2)将视频缩放至目标尺寸500x450的中间区域；3)计算9种不同的裁剪位置(3x3网格)；4)根据需要拼接多个视频片段以达到目标时长180秒；5)为视频添加上下黑色填充区域(上方180像素，下方270像素)，最终输出850像素高度的视频。脚本采用线程池实现并行处理，并包含详细的错误处理和日志输出功能。通过FFmpeg滤镜链实现复杂的视频处理流程，包括缩放、裁剪、翻转、拼接和填充等操作。

2025-06-12 01:26:07 143

空空如也

空空如也