数据通用统计---统一后缀名,统一转换为同一种数据格式

本文介绍了在处理爬取数据时,如何进行文件后缀的统一和数据格式转换。通过统一文件后缀,能简化后续处理步骤,并便于检查数据的可用性。作者提供了C++和Python两种实现方式,利用OpenCV库将多种格式的图片转换为jpg或bmp格式,以确保数据一致性。

 

爬取得到的数据是比较脏的,要进行整理,包括统一后缀和重命名。

统一后缀可以减少以后写数据API时的压力,也可以测试图片是不是可以正常的读取,及时防止未知问题的出现。这很重要。

首先我们看下爬取完些的数据有多少种数据格式。

https://blog.youkuaiyun.com/bevison/article/details/79126410

总之:

爬取下来的数据:

  1. 统一命名:数据更好观察。
  2. 预先读取一遍数据:测试图片是不是可以正常的读取
  3. 统一后缀名:方便下一步转换为其他格式。

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

往事如yan

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值