自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(172)
  • 收藏
  • 关注

原创 2025-08-19利用opencv检测图片中文字及图片的坐标

该代码实现了图片中中文文本的检测与位置计算功能。主要使用CnOcr库进行OCR识别,结合OpenCV和PIL库处理图像。功能包括:1)检测图片中的中文文本及位置坐标;2)计算每个文本的像素宽度和高度;3)在原图上绘制文本边界框并标注识别结果。代码通过put_chinese_text函数解决中文显示问题,最终输出各文本内容、坐标位置及尺寸信息。适用于需要获取图片中文字精确位置的应用场景。

2025-08-19 15:40:23 187

原创 2025-8-19查看单张图片某个点的xy值坐标

该Python脚本使用OpenCV库实现图像坐标点查看功能,主要用于排版和设计时的精确控制。通过cv2.imshow()显示图像窗口,并设置鼠标回调函数show_with_click,当用户点击图像时,会输出点击位置的X/Y坐标和该点的BGR像素值。该工具可帮助设计师直观地调整字号、图形大小和排版位置。代码简洁实用,按任意键可关闭窗口。

2025-08-19 14:39:37 102

原创 2025-08-18基于人脸检测的智能图片裁剪工具

本文介绍了一个基于人脸检测的智能图片裁剪工具。该工具使用MTCNN模型检测图片中的人脸,自动计算最佳裁剪区域,并将结果调整为标准尺寸(295×413)。主要功能包括:1) 单张图片处理(smart_crop),可检测人脸并保持比例裁剪;2) 批量处理(batch_smart_crop),支持对指定文件夹中的所有图片进行自动处理。程序会自动调整裁剪框大小,确保人脸居中,并处理边界情况。输出结果保存为统一尺寸的图片,适合制作证件照等标准化图像处理需求。

2025-08-18 13:22:10 506

原创 2025-08-16批量抠图(人像,动物)

这款批量抠图工具采用Python开发,基于rembg库实现高效背景去除功能。代码支持批量处理JPG、PNG等多种格式图片,自动转换为透明背景PNG格式。通过图像模式转换和字节流处理确保抠图质量,特别适合需要处理大量人物或动物图片的场景。工具提供完整的输入输出文件夹管理,自动创建目录并统一输出为PNG格式,简化了电商设计、内容创作中的批量抠图流程。

2025-08-16 15:58:09 71

原创 2025-08-11批量创建 Pin 图

本文介绍了在Pinterest批量创建Pin图的方法:1)将账号免费升级为企业账号;2)通过批量创建功能上传CSV模板文件;3)提供CSV模板下载链接和示例;4)说明每天200个Pin图的限制;5)建议遇到问题时查看官方帮助文档。整个过程从账号升级到批量上传都有详细指引,适合需要批量发布内容的用户参考。

2025-08-11 18:03:04 217

原创 2025-08-09独立虚拟环境+py文件运行方式(亲测可行)

要让不懂编程的用户使用fat.py脚本和虚拟环境env,最简单的方案是: 创建一个run.bat文件(内容如上),双击即可运行 将env文件夹、fat.py和run.bat一起打包成zip发给用户 用户只需解压后双击run.bat即可使用 更优方案是使用PyInstaller等工具将脚本打包成exe文件,这样用户只需双击exe即可运行,无需安装Python环境。但打包过程需要一定的技术操作。

2025-08-09 00:37:30 180

原创 2025-08-06如何批量下载pinterset官网高清原图作品集图片

3-pinterest图片下载器链接: https://pan.baidu.com/s/1O2kO3xDONVH0YeJ92EFHew 提取码: uuib。必须安装chorme谷歌浏览器,同时要自行解决科学上网,如果不能正常访问behance网站那么该程序也是无法正常下载图片。使用过程有任何问题可以联系沟通。

2025-08-06 00:53:30 302

原创 2025-08-05Gitee + PicGo + Typora搭建免费图床

本文介绍了使用Gitee+PicGo+Typora搭建图床的完整方案。该方案优势在于Gitee是国内平台,5GB免费空间适合个人使用,配合PicGo和Typora可实现图片自动上传。具体步骤包括:注册Gitee并创建仓库、生成私人令牌、安装node.js和PicGo、配置PicGo的Gitee插件、在Typora中设置图片上传服务。文章还详细说明了每个操作步骤的截图指引,包括仓库创建、插件安装、token获取等关键环节,并提供了问题排查方法(如设置时间戳)。最后指出该方案的主要缺点是存储空间有限且无付费扩容

2025-08-05 17:59:34 417

原创 2025-08-03如何批量下载behance官网高清原图作品集图片

使用说明第1步:必须安装chorme谷歌浏览器,同时要自行解决科学上网,如果不能正常访问behance网站那么该程序也是无法正常下载图片 第2步:双击BehanceDownloader.exe文件, 第3步:打开目标网站,选择需要下载的作品并复制作品地址到exe文件输入框; 第4步:程序会自动打开chorme谷歌浏览器访问输入的作品地址;第5步:自动下载作品所有图片,根据作品标题自动创建图片文件夹;第6步:检查下载的图片;都是高清的原图;接下来演示多作品批量下载的

2025-08-03 02:13:10 94

原创 2025-07-30豆包图生图

本文通过系列图片展示了某技术项目或产品的开发过程。图片内容依次呈现了系统界面设计、功能模块展示、操作流程演示等环节,包括初始界面布局、参数设置面板、运行状态监控等关键环节。最后两张图片着重展示了系统的最终效果展示和性能测试结果。整个图片序列完整记录了从设计到实现的全过程,体现了系统良好的交互性和功能性,为读者提供了直观的项目展示。

2025-07-31 01:03:17 91

原创 2025-07-29利用AI按已有平面设计作品进行洗稿

AI洗稿技术实现多风格图文迁移 通过人工智能技术,可将原始图文内容进行风格迁移和内容重构。系统支持多种处理模式:1)保持原主题和场景,对文字进行AI二次创作;2)完全转换视觉风格,生成不同艺术效果的新图像;3)混合模式,同时调整文本和图像风格。演示案例显示,同一组素材可输出卡通插画、水彩风格、极简线条等多种表现形式,文字内容也相应进行了语义保留的改写。该技术适用于内容创作、设计辅助等领域,能快速生成多样化衍生作品。

2025-07-29 14:50:33 127

原创 2025-07-27脚本打包分发技巧(亲测可行)

要让非技术用户顺利运行你的Python脚本,推荐两种简单方法: 批处理脚本方案: 将fat.py和env文件夹放在同一目录 创建run.bat文件(Windows)包含激活虚拟环境和运行脚本的命令 压缩整个文件夹发送给用户,用户只需解压后双击run.bat 打包成可执行文件: 使用PyInstaller将脚本打包为独立exe文件 命令:pyinstaller --onefile fat.py 直接发送生成的exe文件给用户,无需任何额外操作 注意事项: 建议提供简明的README说明操作步骤 虚拟环境可能存

2025-07-27 01:11:41 426

原创 2025-07-26.bat分发方式(待解决)问题

本文介绍了一种通过.bat文件打包Python程序及其虚拟环境的方法,替代传统的pyinstaller打包方式。操作步骤简单:在VSCode中运行指令后,系统会自动生成包含所有依赖项、虚拟环境和批处理文件的压缩包。用户只需解压后双击.bat文件即可运行程序。文中以Behance图片下载器为例,展示了自动生成的使用说明书内容,包含功能特点、操作步骤和注意事项等。这种方法简化了部署流程,特别适合需要完整虚拟环境的Python应用分发。

2025-07-26 22:35:24 211

原创 2025-07-26如何在cline中调用qwen-coder-plus模型

本文介绍了在阿里云平台获取和使用API Key的步骤:首先登录阿里云官网,然后在"Model Studio"中创建API Key;接着通过命令行工具(cline)配置该密钥;最后可在控制台查看API调用情况和使用统计。操作过程配有可视化界面截图指引,帮助用户快速完成API的申请与配置。

2025-07-26 12:54:35 377

原创 2025-07-25设置使用权限N次内

本文介绍了一个带有试用次数限制的文件批量重命名工具。该工具使用AES加密存储试用次数信息,默认允许3次试用。主要功能包括:1)检测并管理加密的授权文件;2)执行文件批量重命名操作;3)自动更新试用次数。当超过试用次数时,会显示开发者联系信息并阻止程序运行。核心代码实现了AES加密/解密功能、试用次数检测和文件重命名逻辑,使用前需配置密钥和授权文件路径。

2025-07-25 21:53:31 860

原创 2025-07-23vscode+cline使用笔记

本文介绍了cline工具的安装与使用指南。首先展示安装成功的截图,然后说明中文插件的安装步骤。基本使用技巧包括:1)打开项目;2)通过Ctrl+Shift+p切换虚拟环境;3)运行程序。重点强调了模型设置步骤,通过多张截图详细说明操作流程。最后讨论了plan与act模式的区别,并提示需要明确理解相关问题。全文配有详细的操作截图,为使用者提供了直观的安装和使用指导。

2025-07-23 18:41:58 334

原创 2025-07-16图片去重,虽然命名不一样但可以去掉相同的图片

本文提供了两个Python脚本用于检测和删除重复图片。第一个脚本针对单个文件夹,使用感知哈希算法(phash)计算图片特征值,通过比较哈希值识别重复图片并删除。第二个脚本扩展功能至处理指定目录及其所有子目录中的图片文件。两个脚本均支持常见图片格式(.png/.jpg等),包含错误处理机制,并输出删除文件统计。使用时需修改目标文件夹路径参数,适合需要批量清理重复图片的场景。

2025-07-16 17:04:19 263

原创 2025-07-16文字语义搜索本地图片(待完善)

本文探讨了如何在本地建立基于语义的图片空间分类系统,主要针对卧室、客厅等空间类型的图片检索。方案采用CLIP模型进行图文特征提取,结合FAISS实现向量检索,并搭建Flask前端展示。为提高识别精度,建议增加批量空间标签识别(使用ResNet或GPT-4Vision自动打标)和多条件过滤功能。文中提供了一个基础实现代码示例,使用CLIP模型计算图片与空间标签的匹配概率,但指出当前识别精度有限,需要进一步优化模型和方案。系统设计考虑了大图库场景,支持超过10万张图片的索引管理。

2025-07-16 11:07:13 393

原创 2025-07-16小规模人工标注(30张主卧设计绝对美/丑图)快速验证

本文介绍了一个基于ResNet18的小样本二分类模型实现,用于图像美学评分。代码实现了完整流程:1)数据加载与预处理,使用ImageFolder加载"beautiful/ugly"二分类训练数据;2)模型构建与微调,采用预训练ResNet18并微调全模型;3)训练过程,使用交叉熵损失和Adam优化器;4)预测功能,对测试图像输出美学评分(0-1概率值)。模型训练后支持批量评分和结果保存为CSV文件。作者建议根据效果选择后续优化方向:表现好则扩充数据集,效果一般可改用NIMA美学模型。代码

2025-07-16 01:55:47 224

原创 2025-07-15通过边缘线检测图像里的主体有没有出血

文章摘要:本文探讨了AI时代精准提问的重要性,指出90%的问题解决在于正确描述问题。作者以筛选"出血图片"为例,展示了三次提问迭代过程,最终通过明确定义"出血"标准(边缘接触线数量、最小长度等)和中文路径处理,使AI生成的代码准确率达到95%。文章对比了国内外AI表现,指出国产AI在中文路径处理等基础问题上仍有差距。最后提供了完整的Python实现代码,包括图像边缘检测、轮廓分析和文件移动功能。

2025-07-15 19:36:33 704 1

原创 2025-07-14如何批量下载behance网站里的图片?

本文介绍了通过浏览器开发者工具批量下载网页图片的操作步骤:1)右击页面选择"检查"打开开发者工具;2)切换至"Network"网络面板;3)筛选"img"图片资源;4)滚动页面加载全部图片;5)点击目标图片查看详情;6)右键保存图片。文末提示如需批量下载可留言咨询。该教程图文并茂地演示了利用开发者工具抓取网页图片的完整流程,适用于需要保存网页图片素材的场景。(135字)

2025-07-14 17:38:28 565

原创 2025-07-13对比两分txt不同处并标注出来

本文介绍了一个Python脚本,用于比较两个文本文件的差异并以加粗标记形式输出。该脚本使用difflib库进行字符级差异比较,将不同之处用加粗显示,相同内容保持原样。功能包括:逐行比较文件内容、标记差异字符、处理不等长文件剩余行。输出结果包含行号、原始内容和差异对比,以60个"-"分隔不同比较结果。适用于需要直观显示文本差异的场景,如代码或文档对比。

2025-07-13 21:42:12 156

原创 2025-07-08【计算机视觉搜索】从1000张户型图中找出最相似的TOP5

摘要:该代码实现了一个基于ResNet50特征提取和Faiss向量检索的户型图相似度搜索系统。系统首先构建图库索引,使用预训练的ResNet50模型(去掉分类层)提取图像特征并归一化,然后将特征向量存入Faiss的L2距离索引。用户上传图片后,系统提取其特征并在索引中搜索最相似的TOP_K张图。代码支持中文路径处理,包含图像预处理、特征提取、索引构建和相似度搜索全流程,最终输出相似图片路径及相似度评分。该系统可用于户型推荐、装修案例匹配等场景。

2025-07-08 23:24:03 87

原创 2025-06-26【数据】批量提取bilibili的视频列表

本文介绍了如何从Bilibili课程页面提取视频标题的Python实现方法。首先需要获取网页HTML源代码,然后通过正则表达式匹配包含标题的div标签。代码提供了完整的提取流程:1)读取HTML文件;2)使用正则表达式提取title属性内容;3)将结果保存到txt文件。程序包含错误处理机制,会提示文件未找到或其他异常情况。运行后会将提取的100个课程标题按序号输出并保存,适合需要批量获取网页内容的开发者使用。

2025-06-26 01:39:24 361

原创 2025-06-18【视觉处理】特征金字塔FPN方法:多尺寸查找小图是否存在大图中

基于深度学习的多尺度图像匹配算法研究 本文提出了一种基于FPN(特征金字塔网络)和ResNet50的多尺度图像匹配方法。通过构建共享权重的FPN骨干网络,实现了对输入图像的多层级特征提取;利用L2归一化层提升特征匹配的鲁棒性;采用组卷积高效计算余弦相似度响应图,并通过多尺度响应融合策略综合不同层级的匹配结果。实验结果表明,该方法能够有效处理不同尺度图像间的匹配问题,并通过可视化响应热力图直观展示匹配效果。代码实现包含完整的预处理、特征提取、响应计算和结果可视化流程,为图像匹配任务提供了一种高效的解决方案。

2025-06-18 15:21:44 132

原创 2025-06-17(思考)什么是相似性搜索?

想象一下,你是一个画画的艺术家,你画了一幅画,但你不确定它和别人画的哪一幅“最像”。你不想一个一个地看别人的作品,你希望有一个“聪明的小助手”帮你找到“最像”的那幅画。这就是“相似性搜索”的作用。相似性搜索 就像一个“聪明的小助手”,它能帮你找到“最像”的作品。它在艺术创作中有很多用处,比如找灵感、找风格、展示作品等等。它通过给每幅画打“标签”来比较它们,然后找到最像的那个。虽然它现在还在学习,但未来会越来越聪明、越来越快!

2025-06-18 00:18:06 244

原创 2026-06-14【视觉】python精准匹配模式:判断大图中包含小图并输出位置

这篇文章介绍了使用Python和OpenCV进行基于SIFT特征的图像匹配方法。通过SIFT算法检测并提取小图(模板)和大图的关键点和描述符,然后使用BFMatcher进行KNN匹配,并通过比率测试筛选高质量匹配点。当匹配点数量超过阈值(如8个)时,判断小图可能包含在大图中,并可视化匹配结果;否则提示未找到足够匹配点。该方法可用于图像识别和内容检索等应用场景。

2025-06-15 02:10:01 307

原创 2025-06-14【视觉】使用边缘检测和轮廓匹配在大图中查找小图(非常好)

本文介绍了一个基于边缘检测和轮廓匹配的图像查找方法。该方法通过Canny边缘检测提取图像特征,利用轮廓匹配技术在大图中定位小图位置。核心步骤包括:图像灰度化、高斯模糊去噪、边缘检测、轮廓提取和匹配评分。程序采用OpenCV实现,支持可视化匹配结果,包含匹配分数和定位框。主要参数可调节边缘检测阈值、轮廓匹配阈值和最小面积比例,适用于不同场景的图像匹配需求。该方法特别适合处理具有明显边缘特征的图像匹配问题。

2025-06-15 01:56:44 375

原创 2025-06-14【视觉】视频转化为图集

本文介绍了一个使用多线程和进度条将视频转换为图片序列的Python脚本。该脚本主要功能包括:1) 以时间格式(时_分_秒_毫秒)或帧索引命名输出图片;2) 通过ThreadPoolExecutor实现多线程处理加速;3) 使用tqdm库显示处理进度条;4) 支持设置帧间隔提取。脚本通过OpenCV读取视频帧,计算时间戳,并以并行的方式保存为图片文件,适用于视频帧分析、时间标注等场景,处理进度可视化且效率较高。

2025-06-14 23:21:32 352

原创 2025-06-14【视觉】批量筛选图集中包含某种物体对象的方法

文章摘要: 该代码实现了一个图像匹配系统,用于在大图文件夹中查找包含指定模板小图的图片。核心功能包括:支持中文路径的图像读取(imread_chinese),使用ORB算法进行特征匹配(find_template_in_image),以及遍历文件夹筛选匹配图片(find_images_containing_template)。系统会将匹配成功的图片保存到指定目录,并输出匹配结果列表。代码采用了OpenCV的ORB特征检测器和暴力匹配器,通过设定距离阈值来判断匹配程度,最终筛选出包含模板的大图。示例图片显示有

2025-06-14 22:54:16 294

原创 2025-06-14[避坑]解决不支持中文路径读取图像的方法

摘要: OpenCV的cv2.imread()在处理含中文路径的图片时出现警告,提示无法读取文件。问题根源在于Windows系统中某些OpenCV版本不支持Unicode路径。解决方案是改用Pillow库读取图片后转为OpenCV格式,并提供了imread_chinese()函数代码示例。其他建议包括:避免中文路径名、检查文件完整性、添加日志记录和保持路径兼容性。该方法能有效解决中文路径导致的图像读取问题。

2025-06-14 22:36:47 609

原创 2025-06-13【视频处理】基于视频内容转场进行分割

摘要:本文探讨了从合并视频中精确分割不同场景片段的方法。通过分析视觉特征(图像帧)、音频信号和语义内容,利用PySceneDetect工具包自动检测场景切换点。文章提供了详细的Python实现代码,包括场景检测、视频裁剪和导出功能。针对不同视频特性,可调整敏感度阈值(15-45)优化分割效果。同时指出可能遇到的问题(如虚假切换、内容变化无画面改变等),并建议结合深度学习模型和音频分析来提升分割精度。该方法适用于讲解类、教程类视频的自动化处理,可实现高效精准的片段提取。

2025-06-13 23:54:25 1056

原创 2025-06-13【api】阿里百炼api调用方法

本文展示了三种调用大模型API实现图像理解的方法,均基于阿里云DashScope平台。方法一通过环境变量配置API密钥,方法二直接写入密钥,方法三支持本地图片识别(需base64编码)。三种方式均使用"qwen-vl-max-latest"模型,可完成图片内容描述、风格识别等任务,代码示例完整展现了从初始化客户端到解析返回结果的全流程。这些方法适用于文生文、文生图、多模态理解等AI应用场景。

2025-06-13 00:14:53 527

原创 2025-06-11[批量裁剪素材视频]

本文介绍了一个使用FFmpeg进行视频批量处理的Python脚本。该脚本主要功能包括:1)获取视频原始尺寸和时长;2)将视频缩放至目标尺寸500x450的中间区域;3)计算9种不同的裁剪位置(3x3网格);4)根据需要拼接多个视频片段以达到目标时长180秒;5)为视频添加上下黑色填充区域(上方180像素,下方270像素),最终输出850像素高度的视频。脚本采用线程池实现并行处理,并包含详细的错误处理和日志输出功能。通过FFmpeg滤镜链实现复杂的视频处理流程,包括缩放、裁剪、翻转、拼接和填充等操作。

2025-06-12 01:26:07 143

原创 2025-06-12【合成视频】

一个简单的视频合成任务,没有想到deepseek,豆包,qwen3.0等国内所谓顶级的模型居然搞了5个小时没有搞出来。实在没办法上梯子到GPT最普通的模型里输入同样的问题。30秒搞定,计算了一下国产众多模型浪费了我多少时间。国产仍需努力,别再天天吹牛B了。

2025-06-12 01:16:49 299

原创 2025-06-09(批量智能裁剪视频尺寸并延长视频时长)

print(f" 使用镜像模式: {mirror_mode}, 裁剪位置: {crop_position}")print(f" 原始尺寸: {width}x{height}, 时长: {duration:.2f}秒")print(f"处理 {filename} 时出错: {str(e)}")print(f"目标尺寸: {TARGET_WIDTH}x{TARGET_HEIGHT}")"""批量处理目录中的所有MP4视频文件""""""获取视频的宽度、高度和时长""""""处理单个视频文件"""

2025-06-10 00:21:21 550

原创 2025-05-30[日常思考]利用人工智能技术识别一张图片是否“好看”或符合设计/摄影美感

利用人工智能技术识别一张图片是否“好看”或符合设计/摄影美感,是一个结合计算机视觉、深度学习和美学评价的复杂任务。,AI已能在特定场景下达到接近专业摄影师的审美判断水平。,AI评分应作为辅助工具而非绝对标准。

2025-05-30 01:46:55 885

原创 2025-05-29[日常思考]如何批量筛选符合审美要求的图片?

摘要:该Python脚本实现了一个"美学图片筛选器",可批量筛选符合"画面干净、简洁、造型简单、色彩统一"标准的图片。通过计算机视觉技术分析图片的清晰度(拉普拉斯方差)、边缘复杂度、留白比例和主色分布等特征,结合K-means聚类算法提取主色。脚本提供可配置的筛选阈值(清晰度、主色数量、边缘复杂度等),并计算综合评分。使用OpenCV处理图像,最终将符合标准的图片自动保存到指定目录,适用于需要批量筛选简约风格图片的应用场景。

2025-05-30 00:42:05 865

原创 2025-05-29[日常思考]如何从众从的图片中挑选是图像画面干净,简洁,造型简单,色彩统一,符合视觉审美的图片?

简洁美学图片筛选指南 如何挑选符合"画面干净、简洁、造型简单、色彩统一"且具美感的图片?核心在于建立清晰的评判标准和高效的筛选流程。 筛选标准: 干净简洁:主体突出、背景纯粹、元素精简 造型简单:几何形态、细节克制、结构明了 色彩统一:色调和谐、配色精简、分布有序 视觉美感:平衡稳定、焦点明确、留白得当 筛选方法: 快速预览:凭直觉初选 逐项评判:对照标准审核 重点关注:负空间运用和色彩模式 技术把关:确保清晰度和纯净度 关键原则:少即是多,主体为王,善用留白,色彩克制。通过多看优秀作品

2025-05-30 00:39:53 372

原创 2025-05-26从图片提取书法文字元素的思路(待测试)

首先,用户可能有很多类似的书法图片,想要批量处理里面的文字图形。还要推荐一些现成的工具,比如Adobe Illustrator的图像描摹功能,或者在线工具如Convertio,这样非技术用户也能操作。另外,用户可能需要保持文字的书法风格,而不仅仅是识别内容,所以提取文字图形而不是识别文字本身。最后,提醒用户注意书法字体的特殊性,比如连笔、飞白效果,这些可能导致分割困难,可能需要手动调整参数或后处理。用户之前让我分析了一张元宵佳节主题的图片,现在他们问如何批量提取这种书法类型的图片里的文字图形。

2025-05-26 09:38:41 360

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除