自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(8)
  • 收藏
  • 关注

原创 电商系统中分布式锁的三种典型使用方式—— 防抖锁、串行锁与幂等控制实践规范

在实际业务中,“锁”并不是一种概念,而是根据业务语义不同,有明确分工。防抖锁(Debounce Lock):防止用户误操作串行锁(Mutex / Sequential Lock):保证同一资源串行执行幂等锁(Idempotent Lock):保证业务只成功一次这三种锁解决的问题完全不同,混用或滥用都会导致隐患。

2025-12-22 16:42:47 990

原创 MySQL 多数据源全量同步方案(Python + Cron 实现)

摘要 本文介绍了使用Python脚本实现MySQL多数据源全量同步的方法,并结合Linux cron定时任务实现自动化执行。脚本支持自动备份目标表、分批插入数据、同步日志记录等功能,适用于企业级数据同步场景,如电商平台的用户行为数据同步、金融系统的交易明细同步等。通过配置源库和目标库参数,脚本能够高效安全地完成数据同步,并记录执行日志便于排查问题,可扩展至多数据源和多业务表的同步需求。

2025-09-26 17:04:42 673

原创 Python 实战:批量提取 .eml 邮件正文图片并按邮件分类保存

本文介绍了一个Python脚本,用于高效提取EML邮件中的嵌入式图片。该脚本解决了手动保存邮件图片效率低、易遗漏的问题。用户只需将EML文件集中存放,运行脚本即可自动创建同名子文件夹,并将每封邮件的所有图片分类保存。脚本支持多种图片格式,可通过修改路径批量处理大量邮件。文中还提供了拓展优化建议,如添加无图片提示、支持更多附件格式等。该方案显著提升了办公效率,避免了重复劳动,特别适合需要处理大量邮件图片的场景。

2025-09-10 14:16:52 318

原创 【Python 爬虫实战】Playwright + aiohttp + BeautifulSoup 批量抓取 Freepeople 商品信息与图片(含完整源码)

本文介绍了一个自动化抓取Freepeople商品信息的Python解决方案。通过Playwright模拟浏览器行为获取完整HTML,结合BeautifulSoup解析数据,使用aiohttp异步下载图片,并利用openpyxl将商品信息输出到Excel。主要功能包括: 自动获取商品各颜色对应的主图和色块图 提取价格、尺码、尺寸说明等关键信息 按商品/颜色建立文件夹结构保存图片 生成结构化Excel表格方便运营使用 该方案采用模块化设计,包含反爬处理、人类行为模拟、异步下载优化等功能,显著提升电商数据采集效率

2025-09-05 09:06:34 1239

原创 Java 实战:用 Jsoup + HttpClient + POI 写一个电商商品爬虫(Orolay 爬虫实战 包含完整源码)

图片默认很小,必须把 URL 中的width=160替换成width=1440才能获取高清图。Excel 插入图片需要设置行高/列宽,否则显示不全。网络波动会导致下载失败,所以加了重试机制。有些商品没有 Size Chart,要判空处理。这个工具能帮运营人员快速整理商品信息,极大减少手工操作。多线程下载图片,加快速度汇总所有商品到一个 Excel,而不是每个商品一个文件增加代理池,提升大规模爬取的稳定性代码我已经开源在文中,大家可以根据需求直接修改。如果这篇文章对你有帮助,

2025-09-05 08:52:43 501

原创 DataEase社区开源版 V2.9 iframe 嵌入限制与解决方案

在开源数据可视化平台 DataEase V2.9 中,默认情况下仪表板和数据大屏无法被 iframe 嵌入到其他页面,这给企业在做内嵌展示、门户集成时带来了不小的困扰。本文将分享我在源码层面解决该问题的实践经验。1:绕过 License 校验的 iframe 限制,将 inIframeError 固定为 false。3:返回完整的分享信息,包括资源 ID、创建者、过期时间、密码校验结果、类型、票据验证等。2:保留令牌验证和密码验证,确保嵌入仍然安全。1:打开源码包,搜索此类。2:找到此方法注释掉。

2025-09-04 19:01:54 788

原创 Java高性能亚马逊SKU图片爬取器:Excel批量输入 + JSON智能解析 + 多视角图片下载

本文介绍了一款基于Java的高性能亚马逊SKU图片爬取工具。该工具能够通过Excel批量导入商品URL,结合智能JSON解析,自动抓取商品的主图、缩略图及多角度视图。借助HTTP代理与随机User-Agent机制,实现稳定反爬访问,同时自动生成分类目录,按色卡信息存储图片,支持高清图下载。本文详细讲解了工具的核心实现原理、数据处理流程以及实用技巧,旨在为电商数据分析、商品管理和自动化运营提供高效可行的技术方案。

2025-09-04 18:07:08 376

原创 Python 爬取淘宝/天猫商品图片并自动整理到 Excel 的实战教程(Playwright + aiohttp)

本文分享了一个基于 Python 的淘宝/天猫商品图片爬取方案。通过 Playwright 模拟浏览器操作,异步抓取商品页面,实现人类行为模拟,避免反爬。使用 BeautifulSoup 提取商品名称、价格、色卡图片和详情图,并用 aiohttp 异步下载到本地文件夹,同时将信息写入 Excel。方案支持批量处理,文件夹按商品和颜色分类,操作自动化且高效,适合电商数据分析和商品管理。整个流程无需手动操作浏览器,登录态复用简化使用,稳定可靠,适合 Python 实战练习。

2025-09-04 17:42:12 469

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除